Hadoop从存储上来说,是类似于冗余磁盘阵列(RAID)的存储方式,将数据分散存储并提供以提供吞吐量,它的存储系统就是HDFS(HadoopDistuibute Fils System);从计算上来说,它通过MapReduce模型,将大数据的计算分发到多台计算机上完成,再将结果合并,减少计算的时间。 Hadoop适合于: 1、超大数据的计算; 2、一次写入、多次读取的模式; 3、可以跑在普通的硬件上。 Hadoop不适合: 1、低延迟的数据访问,它是为高数据吞吐量应用优化的; 2、大量的小文件 hadoop客户端需要和namenode进行交互,而namenode中存放的