文章目录百度文库爬虫(三)DOC/PDF/XLS原格式下载写在最前简介系列文章具体实现Step 1——问题分析Step 2——开始寻找json数据(~~脱发~~)Step 3——全部json数据的获取与图片的获取Step 4——构造本地html文件,并将html文件转换生成pdfStep 4.1——接下来就是要分析一下json数据是被怎么处理的Step 4.2——使用python复现这一段js代码Step 4.3——获取CSSStep 4.4——获取超过50页的内容:warning_selector::warning_selector::warning_selector:需要下载的第三方库(博