大数据项目 使用的工具 - Pyspark,SQL 过程 - 数据预处理- 数据集包含FIFA 2019足球运动员的详细信息。预处理包含以下步骤。 删除数据集中不必要的列,符号。 将值属性转换为浮点值 使用nib-max归一化进行特征缩放 删除包含空值的行 数据分析和数据可视化- 寻找总体球员评级,年龄和球员潜力与每个球员的市场价值之间的相关性。 查找具有最大相关性的两列。 观察到的最大相关性是针对总体玩家评级和每个玩家的市场价值。 绘制总体玩家评分和每个玩家的市场价值以及所需的情节属性 可视化年龄与市场价值和整体球员评分之间的关​​系 使用所需的地块属性绘制玩家的市场价值如何随年龄变化 使用必需的剧情属性绘制玩家总体评分如何随年龄变化 根据他们的整体情况,找到每个职位的前十名最佳球员 使用所需的地块属性绘制每个位置的前十名有价值球员的平均市场价值 使用所需的地块属性绘制每