CNN-旅行新闻-文章刮板 介绍 我构建了一个简单的网络抓取工具,当指定特定的URL时,它将返回cnn旅行新闻文章的内容。 使用类似技术的实际产品的一些示例包括价格跟踪网站和SEO审核工具,这些工具可能会抓取热门搜索结果。 这个项目可能要花我大约4个小时才能完成。 如何运行脚本 就这么简单,只需运行以下代码: python cnn.py 这就是您所需要做的,然后文件将保存在cnn travel news文件夹中。 图书馆 python库在以下位置使用: 请求库这是用来连接新闻网站的。 Beautifulsoup库 这是用来从站点链接中抓取文章中的内容的。 输出 以.txt格式存储的文章