拱门 pip install arche Arche(发音为Arkey )有助于使用一组已定义的规则来验证刮取的数据,例如: 验证 覆盖范围(项目,字段,分类数据,包括布尔值和枚举) 重复项 垃圾符号 两个工作的比较 除了其他工具,我们还在Scrapinghub中使用了它,以确保抓取数据的质量 安装 Arche需要环境,同时支持和 UI 对于JupyterLab,您将需要正确安装 然后只需pip install arche 为什么 连续检查抓取数据的质量。 例如,如果您抓取了一个网站,则典型的方法是使用Arche验证数​​据。 您还可以创建一个架构,然后设置 开发人员设定 pipenv