Ta上传的资源 (0)

此阶段掌握基于Spark上的核心框架的使用; spark作为云计算大数据时代的集大成者,在实时流处理,图技术,机器学习,NoSQL查询等方面具有显著的优势,我们使用spark的时候大部分时间都是在使用其框架如:spark,spark Steaming等

此阶段主要是通过Spark框架的源码研读来深入Spark内核部分 1.通过源码掌握Spark的任务提交过程 2.通过源码掌握spark集群的任务调度; 3.尤其要精通DAGScheduler,TaskScheduler和worker节点内部的工作的每一步的细节;

R是一种语法非常简单的表达式语言(expression language),大小写敏感。 可以在R 环境下使用的命名字符集依赖于R 所运行的系统和国家(系统的locale 设置),允许数字,字母,“.”,“_” 1). 命名 命名必须以”.”或者字母开头,以”.”开头时第二个字符不允许是数字。 2)

Kettle Kettle家族的4个产品:Spoon、Pan、Chef、Kitchen Spoon-转换(transform)设计工具(GUI方式) Pan-转换(transform)执行器(命令行方式) Chef-工作(job)设计工具(GUI方式) Kitchen-工作(job)执行器(命令行方

通过一个完整的具有代表性的Spark项目来贯穿Spark的方方面面,包括项目的架构设计,用的的技术剖析、开发实现、运维等等。

spark高手之路第一章:主要讲述如何搭建spark集群,hadoop的分布式集群环境,以及如何构建spark集群

1、站内搜索的技术选型2、什么是solr3、solr的安装及配置Solr整合tomcat4、使用solr维护索引a)添加b)删除c)修改5、使用solr查询索引6、Solr的客户端SolrJa)solrJ维护索引b)SolrJ查询索引7、综合案例