可以将因特网上的信息按规则采集保存到数据库中,并具备以下功能: 多任务,多线程-可以同时进行多个采集任务,每个任务可以使用多个线程。 网站登录-支持网站登录,并支持网站Cookie,即使需要验证吗才能登录的网站也能轻松穿过。 信息自动识别-提供诸如Email地址、电话号码、数字等多种预先定义好的信息类型,用户经过简单的选取即可从浩瀚的网络信息中提取特定的信息。 网页正文提取-可以将正文从网页htm代码中提取出来并进行适当的格式转换。 采集结果分类-可以根据用户定义的分类信息进行采集结果的自动分类。 预留编程接口-定义多个事件,用户可以利用脚本语言进行编程,扩充采集功能。