Spark 是一个用来实现快速而通用的集群计算的平台。 在速度方面,Spark 扩展了广泛使用的 MapReduce 计算模型,而且高效地支持更多计算模 式,包括交互式查询和流处理。在处理大规模数据集
Spark大数据分析实战 ,高彦杰,倪亚宇著
【哎,机会慢慢失去】Python凭借其简单、易读、可扩展性以及拥有巨大而活跃的科学计算社区,在需要分析、处理大量数据的金融行业得到了广泛而迅速的应用,并且成为该行业开发核心应用的编程语言。《Pytho
本书首先介绍了Spark及其生态系统,接着详细介绍了将分类、协同过滤及异常检查等常用技术应用于基因学、安全和金融领域的若干模式。如果你对机器学习和统计学有基本的了解,并且会用Java、Python或S
学期老师的作业,根据用户推测数据。使用了KMEANS和KNN方法分类。ZSCROS标准化数据。使用MAT进行了XLC的替换功能
难得的spark系统学习资料。书比较新,完整书签。适合系统学习spark的同学
hadoop相关应用及安装方法及Linux上安装集群配置方案都是自己琢磨的应该都可以用很方便适用于数据开发
数据建模和大数据分析过程中特征工程直接影响了数据质量和模型结果,是大数据分析在数据采样后的重要一步
数据平台的建设,实时计算平台的建设,应用实践,系统架构
适合空间大数据分析,结合kafuka、hadoop、hbase、spark等技术
用户评论