目录 一、Hadoop分布式文件系统HDFS 1.认识HDFS 2.HDFS优势 3.HDFS局限性 4.HDFS特性 二、HDFS核心设计 1.数据块 2.数据块复制 3.数据块副本的存放策略 4.机架感知 5.数据块的备份数 6.安全模式 7.负载均衡 8.心跳机制 三、HDFS体系结构 1.主从架构 2.核心组件功能 3.数据块损坏处理 一、Hadoop分布式文件系统HDFS 1.认识HDFS 1)HDFS基于流式数据,为处理超大型文件(PB级别)的需求而设计。 2)流式数据: 将数据序列化为字节流来存储,这样不会破坏文件的结构和内容。字节数据可以分片或者分块切分出来,更方便传输和存储。