该项目旨在通过解决以下开源主题来帮助所有团队成员自学并共同发展数据科学技能。 大致而言,该项目将经历以下阶段: (1)数据探索(具有可视化功能以查找和删除特征/趋势/关系) (2)分析(通过观察数据框和可视化) (3)有监督的机器学习(团队感觉技术准备更接近尾声时) 选择的主题: 其他Kaggle成员的工作(供参考) 我们需要的Python库(随着事情的发展可能会添加更多): 一些自学链接: (Vel指出:我本人仍处于2.和3.中间,因此我们可以在需要时讨论任何令人困惑的部分) 由Tim Buchalka等撰写的课程 任何想要从绝对0开始学习的人都非常适合。过去,这对我有很大帮助。