火花基金会实习 Spark Foundation数据科学和分析实习任务存储库。 任务1:StudentMarksPrediction 根据学习的小时数来预测学生的分数使用线性回归对自变量Hours进行无变量回归以预测可靠变量分数,并进一步使用此回归模型来预测每天学习9.25 hrs的学生分数。 模型验证已通过“适用性良好-R2,MSE”进行了评估。 还测试了T检验和F检验统计量以评估模型。 任务2:使用无监督的ML进行预测 任务:根据给定的“ IRIS”数据集,预测最佳聚类数并直观地表示 数据集: : 任务3:探索性数据分析Retail-SuperStore任务是: (i)作为业务经理,请尝试找出可以工作以获取更多利润的薄弱环节。 (ii)通过探索数据可以得出哪些业务问题? (iii)仪表板-解释图表和解释。