Ta上传的资源 (0)

mapreduce复习资料,供学习下载1.文件处理1 2.概要模式2 2.1数值概要2 2.1.1最大值最小值与计数2 2.1.2平均值6 2.1.3中位数与标准差10 2.2倒排索引概要14 2.3计数器计数17 3.过滤模式21 3.1过滤21 3.1.1分布式grep21 3.1.2简单随机抽

一、概述 1.编译方式与解释方式区别:是否生成目标代码 2.编译程序总框架 二、词法分析 1.状态转换图的功能:识别(接受)一定的符号串(单词) 2.状态转换图的程序实现的思路:为每个状态结点都编写一个子程序 3.字母表的概念:一般用∑表示 4.闭包的概念:闭包V*中的每个字都是由V中的字经过若干

第一章: 大数据和云计算 1 、什么是大数据?海量的数据或海量的数据,通过当前主流的计算机系统,在合理的时间内获得、存储、管理、处理和提炼,足以帮助用户做出决策。2. 大数据具有 4 V 1C (1) 大数据量的特点: 存储的数据量巨大,PB 级别正常 (2) 多样化: 数据来源和格式多样化 (3)