中期项目 DATS 6101:数据科学导论雷汉·拉希德(Rayhaan Rasheed)和玛丽·吉布斯(Mary Gibbs) 总览 该项目探索了包含2个不同文件的教育数据集。 第一个数据集包含与美国每个州的教育有关的收支。 第二个数据集遍​​及每个学区和美国,并分别显示了其四年级和八年级的数学和阅读平均测试成绩。 目的 该项目已分配给我们的小组,以充分了解应采取哪些步骤进行适当的探索性数据分析(EDA)。 我们将这两个数据集合并在一起,创建了一个财务数据框,其中汇总了过去10年中每个州的总收入,总支出和平均考试成绩。 我们的小组着眼于一个州在教育上花费的钱与平均数学考试成绩之间的关系。 方法