本章首先介绍Hadoop的局限与不足,并从全局视角系统总结针对Hadoop的改进与提升;然后,介绍Hadoop在自身核心组件方面的新发展,包括HDFS2.0新特性和新一代资源管理调度框架YARN框架;最后,介绍Hadoop推出之后陆续涌现的具有代表性的新功能组件,包括Pig、Tez、Spark和Kafka等,这些组件对Hadoop的局限进行了有效的改进,进一步丰富和发展了Hadoop生态系统。