Ta上传的资源 (0)

对已批量爬取的url,进行文章下载,分词,建立倒排索引库。数据量过大时,运行时间较长。(我是在服务器上跑的,1.5万条跑了一天)有全文分词和关键词提取。