暂无评论
pyspark里连接kafka数据源所需的jar文件,放到python所在的site-package下属于pyspark的jars目录下
example-spark:Spark,Spark Streaming和Spark SQL单元测试策略
基于Angel和Spark Streaming的高维度在线学习 腾讯数据平台部架构师黄明在全球互联网大会GIAC 2017上的分享
Apache Spark 是一个强大的分布式计算框架,为大数据处理提供高效的并行和流处理能力。Spark Streaming 作为其模块,专门用于处理实时数据流。在中,我们将演示如何在 Spark S
Spark 应用实践分享
陈欢 腾讯资深程序员,15年编码经验,曾任职网络安全、互联网金融等部门,亲手从零建设了财付通业务的Spark集群,并使之同时支持SQL、实时计算、机器学习等多种数据计算场景。他目前就职于腾讯社交与效果
Spark best practice
Spark经典实践
灵活运用RDD的基本操作方法,掌握数据处理的技巧;通过具体案例探索如何利用RDD编程解决实际问题,提升编程能力;使用pyspark交互式编程下载并分析chapter4-data1.txt数据集,
2012年中国系统架构师大会PPT\10虚拟化在京东的实践
暂无评论