yelp spark airflow:使用PySpark和Airflow进行Yelp数据集情感分析和加权评论分数源码

appeasement32579 26 0 ZIP 2021-05-10 09:05:19

目的在Yelp数据集上运行spark作业,结果是: 预测用户评分的情感分析模型根据评论数量调整评分的每个业务的加权评分即5星级的5星级餐厅与1k的4星级餐厅设计:Spark作业从AWS EMR集群运行,并通过Apache Airflow进行编排。这意味着Spark作业是端到端自动化的。该项目基于此帖子中建议的体系结构。先决条件安装安装 S3和EMR的AWS账户凭证将Yelp移动到S3 创建文件dags/aws_credentials.json并更新登录名和密码 { " login " : " " , " password " : " " } 要运行Airflow作业,请转到 EMR学习课程使用s3-dist-cp ,--src arg必须是目录。如果只想移动特定文件,则可以添加一个额

文件列表

yelp-spark-airflow-master.zip (预估有个7文件)

yelp-spark-airflow-master

config

airflow.cfg 34KB

dags

spark_submit.py 7KB

scripts

yelp_script.py 6KB

docker-compose.yml 904B

.gitignore 41B

README.md 2KB

scripts

entrypoint.sh 143B

用户评论

暂无评论

YELPIO使用Yelp数据集提供个性化餐厅推荐的Android应用开发

YELPIO 是一个基于 Android 平台的应用程序，使用 Yelp 数据集为用户提供个性化的餐厅推荐服务。用户可以根据自己的口味和地理位置获取最合适的餐饮选择。这款应用的核心在于其智能推荐系统，

1 2024-10-29
YelpDataSetChallengeTrevor Martin与Ryo Kita参与2014年Yelp数据集挑战

Yelp数据集挑战 Trevor Martin和Ryo Kita参加2014年Yelp数据集挑战。此存储库的代码分为三个部分：文件夹名称语描述数据准备Python解析和格式化数据。数据分析电阻进行统计

5 2024-12-10
apache airflow providers apache pinot feedstock Conda Smithy仓库用于apache airflow p

关于apache气流提供者apache皮诺主页: : 软件包许可证:Apache-2.0 原料许可证: 摘要:Apache Pinot的Apache Airflow提供商开发: : 文档: : 当

28 2021-03-21
Airflow使用指南About云整理.pdf

About云整理的Airflow使用指南1.如何安装和配置Airflow?2.如何通过AirflowUI监控datapipeline（管道）并对其进行故障排除3.什么是AirflowPlatform？

28 2019-09-12
airflow0.6.tar.gz

airflow的linux安装包airflow-0.6.tar.gz下载。

14 2019-09-09
airflow分布式调度

分布式任务调度部署，基于4台机器，采用docker部署，docker做的集群

30 2019-05-04
Airflow初步认识整理文档

此文档是本人经过学习Airflow后整理的文档，里面介绍初步介绍了它的历史，组成架构以及使用。有误之处，欢迎指正。谢谢！

27 2019-01-08
airflow docker compose产生气流源码

阿帕奇气流

15 2021-04-24
Twitter Reviews for Emotion Analysis情感分析推特评论数据集

此数据集由几千个 Twitter 用户评论(输入文本)和情感(输出标签)组成,用于学习如何培训文本以进行情绪分析。此数据集是通过实施关键字使用 Twitter API 创建的。这里的想法是一个数据

58 2021-03-24
细粒度用户评论情感分析数据集AI challenge

共包含6大类20个细粒度要素的情感倾向.数据集分为训练、验证、测试A与测试B四部分。数据集中的评价对象按照粒度不同划分为两个层次,层次一为粗粒度的评价对象,例如评论文本中涉及的服务、位置等要素;层次二

58 2020-08-09

yelp spark airflow:使用PySpark和Airflow进行Yelp数据集情感分析和加权评论分数 源码

文件列表

用户评论

推荐下载

yelp spark airflow:使用PySpark和Airflow进行Yelp数据集情感分析和加权评论分数源码