纽约州的Apache Spark Car Accidents in:这是一个Apache Spark应用程序可推断有关纽约市车祸的定性数据 源码
纽约的车祸 该项目的目的是推断有关纽约市车祸的定性数据。 特别是,要求执行以下查询: 查询1 在整个数据集中每周发生的致命事故数。 查询2 数据集中每个影响因素的事故数和死亡数百分比。 对于每个促成因素,我们想知道由该促成因素引起的事故数量,以及这些致死率中有百分之几是致命的。 查询3 每个行政区每周发生的事故数量和平均致命事故数量。 对于每个行政区,我们想知道该行政区每周发生多少次意外,以及该行政区每周发生的平均致命事故数。 解决方案 上提供了用于执行这三个查询的数据集。 为了完成所请求的查询,认为: 在数据集中,某些行包含不正确的值,因为: # Persons Injure
文件列表
Apache-Spark-Car-Accidents-in-NY-master.zip
(预估有个29文件)
Apache-Spark-Car-Accidents-in-NY-master
results
first_query.png
26KB
show_q3.md
2KB
show_q1.md
1KB
third_query.png
55KB
show_q2.md
1KB
second_query.png
162KB
files
first_query.csv
2KB
暂无评论