第1讲-大数据技术综述; 第2讲_分布式文件系统HDFS; 第3讲_分布式资源管理框架YARN。 大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产