纽约市出租车和计程车数据 最初支持该帖子的代码: 此存储库提供脚本来下载,处理和分析自2009年以来源自纽约市的数十亿计程车和出租汽车(Uber,Lyft等)的。大多数来自NYC出租车和豪华轿车委员会。 数据存储在数据库中,并使用进行空间计算。 截至2019年12月31日的统计数据: 26.3亿人次 16.9亿出租车 9.35亿辆 291 GB的原始数据 数据库在磁盘上占用的空间为391 GB,索引最少 指示 1.安装和 两者都可以通过Mac上的获得 2.下载原始数据 ./download_raw_data.sh && ./remove_bad_rows.sh remove_bad