Python爬虫爬取网页信息
本资源是本人根据慕课网的视频教程整理的一份代码,已调试通过。目的是爬取百度百科1000个词条的网页信息,编程环境是Python3.5.
文件列表
crawl.zip
(预估有个10文件)
crawl
htmlpc.py
2KB
url_manager.py
945B
html_outputer.py
1KB
html_parser.py
1KB
html_download.py
392B
output.html
510KB
__pycache__
html_download.cpython-35.pyc
569B
html_outputer.cpython-35.pyc
1KB
暂无评论