介绍 在此GitHub存储库中,您将找到以下文件:clean_data.py,Randstad_plaatsnamen.json,Niet-Randstad_plaatsnamen和iwo_Final_Project.ipynb。 除此以外的所有其他文件都可以忽略。 Randstad_plaatsnamen.json包含Randstad城市和村庄的所有城市名称。 Niet-Randstad_plaatsnamen.josn包含不在Randstad的所有城市和村庄的城市名称。 iwo_Final_Project.ipynb包含用于在分离的文本文件和列联矩阵中搜索“拖拉机”和“背包客”出现次数的代码。 在文件clean_data.py中,您可以找到代码的说明。 如何获取数据 登录Karora并建立目录(mkdir <名称目录>)。 在Karora中: 提取10-2019年的所有推文