数据工程CapstoneProject 项目总结: 该项目旨在通过使用Pyspark建立一个数据湖来回答有关美国移民的问题,例如哪些国家是最受欢迎的移民城市,该湖可以通过从所有来源提取数据来帮助支持分析。 数据集: