项目指南:S. Ranbir Singh博士副教授,印度理工学院,古瓦哈提

什么是信息检索系统?简而言之,IR系统允许其用户根据搜索文本/查询有效地搜索文档并检索有意义的信息

一个好的IR系统应该——

a) 要快

b) 节省空间

c) 准确

d) 以“智能”的方式理解用户的查询

该项目的构成是什么?

该项目是一个简单的IR系统,具有以下组成部分:

1) 高效的文档索引数据结构

2) 一种排序算法,用于检索与查询最相关的文档

3) 页面排序算法,根据检索到的文档的“重要性”对其进行排序

4) 摘要算法,用于显示每个文档的摘要及其Web链接

如何使用它?

  1. 进入src目录

  2. 运行python main.py [-c](-c用于索引重建)