项目指南:S. Ranbir Singh博士副教授,印度理工学院,古瓦哈提
什么是信息检索系统?简而言之,IR系统允许其用户根据搜索文本/查询有效地搜索文档并检索有意义的信息。
一个好的IR系统应该——
a) 要快
b) 节省空间
c) 准确
d) 以“智能”的方式理解用户的查询
该项目的构成是什么?
该项目是一个简单的IR系统,具有以下组成部分:
1) 高效的文档索引数据结构
2) 一种排序算法,用于检索与查询最相关的文档
3) 页面排序算法,根据检索到的文档的“重要性”对其进行排序
4) 摘要算法,用于显示每个文档的摘要及其Web链接
如何使用它?
-
进入src目录
-
运行
python main.py [-c]
(-c用于索引重建)
暂无评论