大数据的数据来源广泛,应用需求和数据类型都不尽相同,但是最基本的处理流程是一致的。 整个大数据的处理流程可以定义为,在合适工具的辅助下,对广泛异构的数据源进行抽取和集成,将结果按照一定的标准进行统一存储,然后利用合适的数据分析技术对存储的数据进行分析,从中提取有益的知识,并利用恰当的方式将结果展现给终端用户。 具体来讲,大数据处理的基本流程可以分为数据抽取与集成、数据分析和数据解释等步骤。 数据抽取与集成 大数据的一个重要特点就是多样性,这就意味着数据来源极其广泛,数据类型极为繁杂。这种复杂的数据环境给大数据的处理带来极大的挑战。 要想处理大数据,首先必须对所需数据源的数据进行抽取和集成,从