Spark快速大数据分析高清完整版带书签SparkRDD,SpringSQL
本书是Spark实战指南,全书共分8章。前4章介绍Spark的部署、工作机制和内核,后4章分别通过实战项目介绍SparkSQL、SparkStreaming、SparkGraphX和SparkML
本书采用基于项目的方法,介绍用Python完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。主要内容包括:Python基础知识,如何从CSV、Excel、XML、JSON和PDF文
大数据处理--Hive技术架构及应用,主要介绍了数据仓库相关知识,对数据仓库与关系数据库进行详细比较。针对数据仓库海量数据的统计分析,而引入Hive,接着分别介绍了Hive架构、工作过程及与关系数据库
Spark入门完整版PDF版,从生态圈部署安装编程模型运行框架streamsqlmllibgraphxtachyon安装部署介绍
讲述Intel和大数据的发展: 大数据处理时代英特尔的角色 提供高效的计算芯片、存储、I/O、网络技术,加速大数据价值挖掘与提高决策反应; 提供最优的软件和工具,推动大数据应用的部署和创新; 促进大数
Android应用性能优化(完整版)带书签
sklearn在中小型数据集上,在工业界是在使用的 xgboost、lightgbm在工业界的实用度非常的高 工业界数据体量真的达到上亿或者十亿这样的规模用sklern处理起来是比较吃力的, 可借助于
Hadoop是目前采用*广、*重要的一种开源的大数据处理平台,读懂Hadoop的源代码,深入理解其各种机理,对于掌握大数据处理的技术有着显而易见的重要性。本书从大数据处理的原理开始,讲到Hadoop的
内容简介汇集作者在大众点评和1号店实时平台的大数据实践讲解基于Storm的流数据处理的整体解决方案《Storm技术内幕与大数据实践》内容主要围绕实时大数据系统的各个方面展开,从实时平台总体介绍到集群源
用户评论