建立机器学习管道 汉尼斯·哈普克(Hannes Hapke)和凯瑟琳·纳尔逊(Catherine Nelson)撰写的O'Reilly出版物的代码存储库 设置演示项目 下载初始数据集。从该存储库的根目录执行 python3 utils/download_dataset.py 该脚本运行之后,您将拥有一个包含文件consumer_complaints_with_narrative.csv的data文件夹。 数据集 可以使用上面的脚本下载此示例项目中使用的数据。该数据集来自从美国消费者金融保护局收集的有关客户投诉的公共数据集。如果您想复制我们编辑过的数据集,请执行以下步骤: 从下载数据集 将列重命名为[ "product", "sub_product", "issue", "sub_issue", "consumer_complaint_narrative", "company", "stat