使用Python进行数据科学项目 旨在为您提供有关中行业标准数据分析和机器学习工具的实用指南,并提供实际数据。 本课程将帮助您了解如何使用pandas和Matplotlib来严格检查具有摘要统计信息和图形的数据集,并提取要寻求的见解。 使用scikit-learn包,您将在学习如何准备数据并将其提供给机器学习算法(例如正则化逻辑回归和随机森林)的过程中继续建立自己的知识。 您将发现如何调整算法,以对新的和看不见的数据提供最佳预测。 在后面的章节中,您将能够了解这些算法的工作原理和输出结果,不仅可以深入了解模型的预测能力,还可以深入了解进行这些预测的原因。 Stephen Klosterman