基于配置文件的可扩展数据采集方案,肖宏,,网络上存在大量的异构数据,大部分都以网页的形式呈现。高效的采集这些数据并使得采集方案具有较高的兼容性和可扩展性是商业应用