spark streaming实时网站分析项目实战.rar

Terence_ 18 0 RAR 2020-08-19 19:08:01

操作步骤: 一.数据采集:视频网站访问日志(编辑python脚本) 1.Python日志产生器开发URL ,ip信息,状态码,时间等 2.python日志产生器测试并将日志写入到文件中 3.通过定时调度工具每一分钟产生一批数据 4.使用flume实时收集日志信息 5.对接实时数据到kafka并输出到控制台 6.spark streaming对接kafka的数据进行消费数据采集详情:项目其他\数据采集.docx 二.数据清洗:见项目使用spark streaming完成数据清洗操作三.数据分析:见项目功能一: 统计到今天为止视频的访问量 yyyyMMdd cours

用户评论

暂无评论

Flume对接Spark Streaming的相关jar包

这个压缩包中包含的是Flume-1.6.0对接Spark-1.6.2下的Spark Streaming时需要用到的jar包，将这些jar包放置到flume安装目录下对应的lib中

17 2020-07-16
2_3_Spark加Streaming.pdf

spark程序是使用一个spark应用实例一次性对一批历史数据进行处理，sparkstreaming是将持续不断输入的数据流转换成多个batch分片，使用一批spark应用实例进行处理。

30 2019-07-08
spark_streaming_flume_sink_2.11_2.1.0.jar

使用spark集成flume，由于flume默认只支持pull消息的方式，不过它可以自定义消息拉取方式，现要使用poll方式，可以使用spark-streaming-flume-sink_2.11-2

44 2019-01-02
spark_streaming_kafka_assembly_2.10_1.6.3.jar

运行saprk-streaming所需的jar包,spark-streaming-kafka-assembly_2.10-1.6.3.jar

48 2019-01-02
spark streaming kafka08assembly_2.112.4.3.jar

pyspark里连接kafka数据源所需的jar文件,放到python所在的site-package下属于pyspark的jars目录下

19 2020-08-11
example spark SparkSpark Streaming和Spark SQL单元测试策略源码

example-spark:Spark,Spark Streaming和Spark SQL单元测试策略

12 2021-02-09
Spark大型项目实战电商用户行为分析大数据平台

本项目主要用于互联网电商企业中，使用Spark技术开发的大数据统计分析平台，对电商网站的各种用户行为（访问行为、购物行为、广告点击行为等）进行复杂的分析。用统计分析出来的数据，辅助公司中的PM（产品经

44 2019-03-11
spark最佳实战

spark最佳实战-------------------------------------------------------------------------------------------

22 2020-05-26
Spark实战.docx

1.Spark是特性高可伸缩性高容错于内存计算2.Spark的生态体系（BDAS，中文:伯利克分析栈）MapReduce属于Hadoop生态体系之一，Spark则属于BDAS生态体系

49 2020-03-17
Spark GraphX实战

SparkGraphX实战

52 2019-06-01

spark streaming实时网站分析项目实战.rar

用户评论

推荐下载