OpenRefine是一款相当优质开源数据清洗和转换的工具,可以对各种杂乱的表格数据进行深度处理,带来了深度的清理操作,可以强的对各种数据进行处理和优化,使用起来非常的方便,能够更好的去进行操作和处理,快来下载试试吧!
1、支持智能数据聚类,自动识别并合并语义相似但拼写不同的条目,快速消除数据中的重复项。
2、具备强大的GREL表达式引擎,允许用户编写逻辑公式来进行复杂的文本替换、日期格式化及数值计算。
3、提供分面浏览功能,有效的通过各种不同方面快速筛选数据子集,直观发现异常值与数据分布规律。
4、支持多格式导入导出,各种不同的格式内容,并能直接连接MySQL等数据库进行操作。
集成外部数据扩展,可通过插件连接Wikidata等知识图谱,自动补全实体信息或进行跨表数据关联。
拥有完整的操作历史,每一步清洗动作都会被记录在案,支持随时撤销、重做或导出操作脚本供后续复用。
具备处理大规模数据能力,采用流式处理技术,即便面对百万行级别的数据量也能保持流畅,不易发生内存溢出。
支持插件扩展生态,允许安装各种脚本和插件,无限拓展软件在地理编码、机器学习等领域的能力。
打开软件安装包,同意软件的安装协议。

接着设置软件的安装位置。

随后进行安装即可。
