covid19 analytics:该存储库用于covid19 analytics 源码
环境: Spark版本:3.0.1 的Python版本:3.7 只读文件: src/app.py src/tests/test_pipeline.py src/main/__init__.py src/main/base/__init__.py src/main/job/__init__.py install.sh data/country_vaccinations.csv 要求: 在这个挑战中,您将实现一个PySpark管道,该管道对COVID-19疫苗数据进行一些基本分析。 您可以在文件夹data找到数据样本 country_vaccinations.csv 这是COVID-19疫苗数据,记录了世界各地随时间推移的疫苗接种进度。 数据格式为country,date,total_vaccinations,vaccines country :这是提供疫苗接种信息的
文件列表
covid19-analytics-main.zip
(预估有个22文件)
covid19-analytics-main
.travis.yml
216B
data
country_vaccinations.csv
104KB
src
app.py
1KB
tests
__pycache__
test_pipeline.cpython-37-pytest-6.2.2.pyc
6KB
__init__.cpython-37.pyc
145B
暂无评论