基于10000网页python搭建搜索引擎课程设计
10000网页简单上手,代码和配置环境全部写好,傻瓜式操作。 执行文件顺序是 1.Spider.py进行爬取网页并分析 2.index.py生成倒排索引,idf文件 3.app.py运行搜索引擎 4.在默认浏览器输入 http://localhost:8080/ 进行检索 若要使用数据库 1.writeDB.py写倒排索引与idf(时间较长) 2.可以在summary.py切换from DB_search import s使用数据库 注意: 还需要停用词是stopwords.txt
文件列表
小型搜索引擎程序.rar
(预估有个25文件)
小型搜索引擎程序
环境配置文档.txt
581B
Spider.py
5KB
writeDB.py
3KB
templates
baidu.html
714B
search.html
3KB
top_k.py
1KB
summary.py
5KB
static
暂无评论