python抓取 爬可能不是最困难的。 但是,棘手的部分是,信息链接(单元格“违规者信息”)中超过90%的内容被图像代替了文本; 此“错误”将使last-words.json中的“ Info”键不完整,因此需要亲自对其进行硬编码。 语句链接(单元格“ Last Statement”)也很棘手。 语句页面由许多段落组成,直到后来我才发现某些语句被分成不同的段落而不是换行符。 “错误”也需要进行硬编码。 在许多段落中也有一些怪异的加密,此问题已针对该项目进行了修复。 这些是在此文件夹中运行scrape_death.py会遇到的问题。 总体而言,我对python完全陌生,但是这是一次不错的学习体