SearchingSystem:python实现的基于倒排索引和向量空间模型实现的信息检索系统 源码
信息检索系统 利用倒排索引和向量空间模型实现的信息检索系统。 完成工作: 带位置信息的倒排索引 转化空间模型 TOP K查询 BOOL查询 初步查询 拼写矫正 名词查询 拼写矫正(以下) 运行 环境要求:python3 在初次运行程序前请下载词干还原依赖的语料库 在SearchSystem/main.py中已经注释掉下载语料库的命令 nltk . download ( "wordnet" ) nltk . download ( "averaged_perceptron_tagger" ) nltk . download ( "punkt" ) nltk . download ( "maxnet_treebank_pos_tagger" ) 取消注释后运行一次即可,语料库下载完成立即正常运行 Windows下如果嫌弃弃语料库下载比较慢,可以直接转到目录下的nltk_data文件夹nltk_d
文件列表
SearchingSystem:python实现的基于倒排索引和向量空间模型实现的信息检索系统
(预估有个10899文件)
adj.exc
22KB
citation.bib
212B
data.adv
505KB
index.adj
805KB
noun.exc
37KB
index.adv
159KB
data.adj
3.01MB
verb.exc
37KB
adv.exc
85B
6657.html
7KB
暂无评论