数据科学项目模板 这是数据科学项目的入门模板; 它包含文件结构,并提供一些代码来指导您。 (在分叉此存储库之后,请替换此部分以描述您的项目和目标。它应该简短,最多2句话。) 介绍 GitHub允许我们管理代码并与他人合作。 不仅适用于数据科学家,而且适用于为个人或工作项目编程的任何人。 它是一个平台,可作为您的技术产品组合,是任何人阅读您的代码和报告的绝佳平台。 对于您的项目,如果可能的话,我建议您对一个报告使用多个笔记本。 您可以将每个笔记本专用于数据科学项目管道中的某个阶段。 这在构建数据科学项目时非常有用,因为通常会有明确的阶段,例如EDA和建模。 这使您的项目更易于消化,因为某人可以在特定阶段运行一个笔记本,而不用运行一个冗长的笔记本。 我还建议在每个阶段将数据/模型另存为单独的文件。 将它们保存在文件夹中,然后将其重新导入下一阶段使用的笔记本中。 尽量保持笔记本电脑的清洁和