随着“大数据”的持续增长和信息货币化越来越重要,越来越多的企业加入到构建数 据仓库和寻求数据分析解决方案的队伍中来。Hadoop 由于其出色的非结构话和半结构话数 据的分析能力,以及其廉价的大规模集群解决方案使其成为了大多数企业青睐的对象。然而 另一方面,关系数据库对于结构化数据的快速查询的能力却是Hadoop 没有的。因此,企业 的数据总是存储于关系型数据库中,以满足快速查询的需要。尽管同时使用Hadoop 和关系 10 数据库可以弥补彼此的不足。然而令人无奈的是,当使用一方作为数据源时,我们无法从另 一方自由地进行查询。终于在Hadoop 0.19 版本时,新增的DBInputFormat