10000网页简单上手,代码和配置环境全部写好,傻瓜式操作。 执行文件顺序是 1.Spider.py进行爬取网页并分析 2.index.py生成倒排索引,idf文件 3.app.py运行搜索引擎 4.在默认浏览器输入 http://localhost:8080/ 进行检索 若要使用数据库 1.writeDB.py写倒排索引与idf(时间较长) 2.可以在summary.py切换from DB_search import s使用数据库 注意: 还需要停用词是stopwords.txt