p2-group-1 第1组的项目2(Cameron,Carrel,Chris,Tristan)。 Spark存储和Twitter数据集的操作 技术领域 Apache Spark Spark SQL 纱 HDFS和/或S3 Scala Git + GitHub 目标 使用其各自的API分析来自Twitter的流数据和历史数据 从执行必要分析的scala项目构造.jar包 在AWS云服务EMR中存储和访问API数据 制作一组简单的幻灯片,在分析中显示我们的发现 相应中的任何其他提及 项目设置和执行 建立 将回购文件克隆/拉入项目文件夹 从AWS,Twitter和Azure TextAna