Haw数据清洗和抓取工具 HAWK是一种数据采集和清洗工具,依据GPL协议开源,能够灵活,有效地采集来自网页,数据库,文件,并通过可视化地拖拽,快速地进行生成,过滤,转换等操作。其功能最适合的领域,是爬虫和数据清洗。Hawk的含义为“鹰”,能够高效,准确地捕杀猎物。HAWK使用C#编写,其前端界面使用WPF开发,支持插件扩展
Hawk20数据清洗和抓取工具 增加动态页面嗅探,超级模式,修复120项问题,Hawk 2.0发布! HAWK是一种数据采集和清洗工具,依据GPL协议开源,能够灵活,有效地采集来自网页,数据库,文件, 并通过可视化地拖拽, 快速地进行生成,过滤,转换等操作。其功能最适合的领域,是爬虫和数据清洗。 Hawk的含义为“鹰”,能够高效,
Hawk3.0数据清洗和抓取工具 Hawk3 于2018年5月正式发布,交互极大优化,增强了子任务功能,支持sqlite等。 项目地址: https://github.com/ferventdesert/Hawk