NoSQL数据库种类介绍、大数据关键技术、大数据计算模式、大数据处理架构 分布式文件系统HDFS、分布式数据库HBASE、NoSQL、大数据处理与分析。 Hadoop分布式文件系统,具有处理超大数据、流式处理、可以运行在廉价商用服务器上等优点。对于超大数据集的应用程序而言,选择HDFS作为底层数据存储是较好的选择。 Hive是基于Hadoop的数据仓库工具,可以用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储。(学习门槛较低,提供了类似于关系数据库SQL语言的查询语言=Hive QL),Hive自身可以将Hive QL语句转换为MapReduce任务进行运行,而不必