Wikipedia_Data Science Challenge 源码
Wikipedia_Data-Science-Challenge 使用以下命令安装所有必需的库 pip install -r requirements.txt 如果遇到问题,可能必须先更新点 python -m pip install --upgrade pip 前处理 创建了一个简单的预处理类,以作为pandas DF (data frame)从database (sqlite3 - lightweight disk-based database)读取数据。 预处理类包含一些方法,可帮助我们形成干净的DF,可将其进一步用于数据可视化。 它outputs 2 DF ,可进一步用于绘制所需度量 请参考preprocess.py 探索性数据分析 使用一个漂亮的可视化库plotly了整洁的python的Wikepedia流数据的综合探索性数据分析。 在此分析中,我使用了从下载的给定挑战