news search engine:新闻搜索引擎 源码
新闻搜索引擎 使用方法 安装python 3.4+环境(推荐或 ) 安装lxml html解析器,命令为pip install lxml 安装jieba分词组件,命令为pip install jieba 安装Flask Web框架,命令为pip install Flask 进入web文件夹,运行main.py文件 :浏览器,访问输入关键字开始测试 如果想抓取最新新闻数据并编制索引,一键运行./code/setup.py ,再按上面的方法测试。 2020.4.5:添加抓取的爬虫程序。先运行./code/spider.chinanews.com.py爬取最近5天新闻(约2500条);然后注释./
文件列表
news-search-engine:新闻搜索引擎
(预估有个2480文件)
news_search_engine2.png
98KB
.gitattributes
378B
news_search_engine1.png
208KB
config.ini
260B
spider.chinanews.com.py
5KB
recommendation_module.py
6KB
index_module.py
4KB
news_search_engine4.png
117KB
main.py
4KB
ir_web.iml
517B
暂无评论