基于HDFS的小文件存储与读取优化策略,马建红,张海,本文首先对HDFS分布式文件系统进行了深入的研究,在HDFS中以流式的方式访问大文件时效率很高但是对海量小文件的存取效率比较低。本�