《python数据科学指南》的源代码,本书从讲解如何在数据科学中应用Python开始,陆续介绍了Python的工作环境,如何用Python分析数据,以及数据挖掘的概念,然后又扩展到机器学习。本书还涵盖了缩减原则、集成方法、随机森林、旋转森林和超树等方面的内容,这些都是一个成功的数据科学专家所必需掌握的。阅读本书,你将学会:■揭示数据科学算法的完整范畴;■高效地掌握和使用numpy、scipy、scikit-learn和matplotlib等Python库;■了解进阶回归方法的建模和变量选择;■进一步彻底理解集成方法的潜在含义及实施;■在各种各样的数值和文本数据集上解决实际问题;■熟悉先进的算法,如梯度提升、随机森林、旋转森林等