spark高手之路spark架构设计与编程模型 此阶段掌握基于Spark上的核心框架的使用; spark作为云计算大数据时代的集大成者,在实时流处理,图技术,机器学习,NoSQL查询等方面具有显著的优势,我们使用spark的时候大部分时间都是在使用其框架如:spark,spark Steaming等
spark高手之路内核揭秘 此阶段主要是通过Spark框架的源码研读来深入Spark内核部分 1.通过源码掌握Spark的任务提交过程 2.通过源码掌握spark集群的任务调度; 3.尤其要精通DAGScheduler,TaskScheduler和worker节点内部的工作的每一步的细节;
R语言实战和案例 R是一种语法非常简单的表达式语言(expression language),大小写敏感。 可以在R 环境下使用的命名字符集依赖于R 所运行的系统和国家(系统的locale 设置),允许数字,字母,“.”,“_” 1). 命名 命名必须以”.”或者字母开头,以”.”开头时第二个字符不允许是数字。 2)
kettle操作手册和基本用法 Kettle Kettle家族的4个产品:Spoon、Pan、Chef、Kitchen Spoon-转换(transform)设计工具(GUI方式) Pan-转换(transform)执行器(命令行方式) Chef-工作(job)设计工具(GUI方式) Kitchen-工作(job)执行器(命令行方
solr学习心得和总结笔记 1、站内搜索的技术选型2、什么是solr3、solr的安装及配置Solr整合tomcat4、使用solr维护索引a)添加b)删除c)修改5、使用solr查询索引6、Solr的客户端SolrJa)solrJ维护索引b)SolrJ查询索引7、综合案例