Hadoop是Apache的一款开源框架,使用java语言编写,可以通过编写简单的程序来实现大规模数据集合的分布式计算。工作在Hadoop框架上的应用可以工作在分布式存储和计算机集群计算的环境上面。Hadoop具有高扩展性,其集群能够从单台机器扩展到数千台机器。Hadoop采用的是Apachev2协议,Hadoop基于Google发布的MapReduce论文实现,并且应用了函数式编程的思想。