使用Apache Cassandra激发数据建模的案例研究 概括 该项目旨在帮助Sparkify音乐创业公司在Apache Cassandra中建立数据库以查询其数据。 到目前为止,它们的数据位于应用程序上用户活动的CSV文件目录中。 此存储库中的代码是按会话,用户会话和用户播放的歌曲到数据库中的音乐表的ETL。 指示 将用户活动文件加载到event_data。 运行Project_1B_ Project_Template.ipynb以提取,转换并加载到Apache Cassandra中。 回购结构 event_data :包含应用程序中的用户活动,即CSV文件。 images :图片。 Project_1B_ Project_Template.ipynb :带有用于构建ETL流程的所有代码的笔记本。 它创建以下表格: music_by_session user_session