暂无评论
首先介绍分布式文件系统的基本概念、结构和设计需求,然后介绍Hadoop分布式文件系统HDFS,详细阐述它的重要概念、体系结构、存储原理和读写过程,最后,介绍了一些HDFS编程实践方面的知识
作者:厦门大学计算机科学系林子雨(ziyulin@xmu.edu.cn) 工信部”全国云计算及大数据应用技术人才培训考试项目”唯一指定大数据教材 全国多所高校大数据课程选用本教材 多为研究生阶段
对于课程的基本介绍,包括课程特色、教材介绍、篇章安排、主讲教师和助教等
大数据技术原理与应用 第三章 分布式文件系统HDFS 学习指南
熟悉常用的HDFS操作(1)理解HDFS在Hadoop体系结构中的角色;(2)熟练使用HDFS操作常用的Shell命令;(3)熟悉HDFS操作常用的JavaAPI。
章节说明:教材只需要授课第1章到第11章,因此,只提供前11章讲义PPT;第12章和13章属于学生自学内容,不需要授课,不用讲义PPT。 新增章节:2015年8月1日出版发行的《大数据技术原理与应用》
Chapter1--大数据技术原理与应用-第1讲-大数据概述.pdf Chapter2--大数据技术原理与应用-第2讲-大数据处理架构Hadoop.pdf Chapter3--大数据技术原理与应用-第
1 大数据概念和应用领域 大数据的四个特点(4V),数据体量巨大、数据类型繁多、价值密度低商业价值高、处理速度快。 大数据应用领域:医疗行业、能源行业、通信行业、零售业等。 2 大数据关键技术 文件系
第四章分布式数据库中 HBase 内容的总结: 首先介绍了 HBase 的起源及其与关系数据库的区别。然后介绍了 HBase 的访问接口、数据模型、实现原理和运行机制,最后介绍了 HBase 编程实践
首先介绍流计算的基本概念和需求,分析了MapReduce框架为何不适合处理流数据;然后,阐述了流计算的处理流程和可应用的场景;接着介绍了流计算框架Storm的设计思想和架构设计;最后,通过实例来加深对
暂无评论