我们已经完成了对Hadoop需求的探索,并看到了VPC与EC2搭配起来让EMR服务更具效率的操作。通过建立一个新的VPC,我们看到默认设置如何提供通信,以及构成Hadoop集群的实例需求,并通过修改这些行为来影响EMR。时下,VPC已经成为发布AmazonEC2实例的默认环境,因此掌握Amazon VPC环境中的AmazonEMR集群运行原理至关重要。在这篇博文中,我们将弄清楚为什么需要在EC2VPC环境中运行Hadoop集群。然后,我们将建立一个新的VPC环境,并发布一个EMR集群。这是这系列博文的第一部分,第二部分我们将详细介绍