本文主要介绍了数据湖是什么以及相关的概念,有什么特点及数据湖架构。 本文来自公众号《韩锋频道》,由火龙果软件Anna编辑、推荐。 数据湖这一概念,最早是在2011年由CITOResearch网站的CTO和作家DanWoods首次提出。其比喻是:如果我们把数据比作大自然的水,那么各个江川河流的水未经加工,源源不断地汇聚到数据湖中。业界便对数据湖一直有着广泛而不同的理解和定义。“数据湖是一个集中化存储海量的、多个来源,多种类型数据,并可以对数据进行快速加