python_crawler:它被设计为使用json和sqlite而不是mysql或mongdb的简单小巧实用的python搜寻器。 目的地网站是Zhihu.c
python_crawler 本项目旨要做一个轻量,易读,方便扩展的知乎爬虫。 设计之初就尽量避免避免额外的框架和数据库引擎,因此它是一个python原生爬虫,数据库采用的是最轻便的sqlLite。所有的定制信息都从config文件导入,修改它可以实现定制功能。 效果展示 前端展示 数据库展示 首要条件 为方便数据库与对象的映射,更新了SQLAlchemy;为了提供网页服务器,采用了Flask,此外没有其他包了。 pip install sqlalchemy pip install flask 文件介绍 根目录 zhihu.db保存爬虫信息的sqlite数据库文件 temp.json保存不需
文件列表
python_crawler-master.zip
(预估有个32文件)
python_crawler-master
temp.json
367B
zhihu.db
10.43MB
frontend
templates
test.html
1KB
index.html
7KB
static
css
comon0.css
7KB
暂无评论