本文来自于简书,本文主要介绍为什么需要分布式文件系统以及HDFS对文件的存储读取和如何使用HDFS,希望对您的学习有所帮助。HDFS作为Hadoop的核心部分,是Hadoop中MapReduce框架的存储层。 当文件的大小超过了单台计算机的存储能力时,就需要将其分区存储在不同单独的计算机上。 分布式文件系统概念图文件系统的三个主要组成部分:被管理的文件、文件管理相关软件、实施文件管理所需要的数据结构将文件分布式存储后带来的问题:文件不完整,系统复杂度加大,引入网络编程