python爬虫大作业爬取豆瓣影评
1数据描述数据来源豆瓣最受欢迎的影评数据获取豆瓣最受欢迎的影评并将获取的这些信息评论链接电影名电影详细地址评论标题以及评论地址等写入excel表格同时也会生成词云.2数据获取步骤第一步调用获取页面信息的函数获取并保存html页面信息使用html.parser解析器查找符合要求的字符串对电影的html代码再次使用bs4解析将电影的信息加入datalist.第二步创建workbook对象创建工作表建立列名将评论链接电影名电影详情地址评论标题评论正文写入数据并保存.第三步生成词云将text进行分词使用plt库展示图片保存到文件.第四步打开或创建数据库文件执行sql语句提交数据库操作关闭数据库连接即成功建表.第五步将获取到的数据保存到xls表格并保存到数据库.
文件列表
python爬虫大作业,爬取豆瓣影评
(预估有个2000文件)
cpu_popcnt.c
1KB
cpu_sse2.c
697B
cpu_avx512cd.c
759B
cpu_avx512_cnl.c
948B
cpu_ssse3.c
705B
cpu_avx512_knl.c
956B
cpu_avx512f.c
755B
cpu_avx512_skx.c
1010B
cpu_avx512_knm.c
1KB
cpu_asimd.c
704B
暂无评论