此存储库包含的资源材料是edX中UC San DiegoX的Data Science MicroMasters计划的一部分,该计划引入了分析数据和进行数据科学所需的强大的开源工具集合。 数据科学,也称为数据驱动科学,是科学方法,过程,算法和系统的跨学科领域,可以从类似于数据挖掘的各种结构化或非结构化形式的数据中提取知识或见解。 在本课程中,介绍了数据科学领域中一些最常用的python软件包。 关于Jupyter笔记本,Numeric Python,Matplotlib,Pandas,NLTK,Sci-Kit和许多项目以及kaggle中记录的著名数据集的非常有效的概述。 更新2019 现在,本