让Spark飞用Amazon Elastic MapReduce构建弹性和高可用性的Spark集群 Parviz Deyhim是亚马逊网络服务的解决方案架构师。Parviz为许多AWS的客户,帮助他们构建可扩展,高度可用和安全的基础架构。在此之前Parviz花了很多年的时间在CDN(内容分发网络)行业,在那里他帮助客户发布他们的内容。在此次Spark峰会上Parviz主要介绍了Spark在Amaz
把Docker打造成虚机搜狗 很多公司已经使用物理机和vm很多年,以机器为粒度做运维,积累了很多运维工具和平台。弊端很明显,但又难以一下子切换到docker推崇的微服务架构。既想平滑兼容既有平台,又想充分利用docker的好处,how to?于是就有了我们的尝试:把docker改造成虚机的样子。
Catalyst一个Spark和Shark的查询优化框架 Databricks高级软件工程师Michael Armbrust,在此次峰会上就什么是查询优化、简捷的查询规划、优化执行、优先工作、Catalyst做了详细介绍,总之Catalyst是一个关系运算符的优化树架构。
StratioDeep一个在Spark和Cassandra之间的集成层 Stratio高级架构师Luca Rosellini:在此次峰会上和其同事Oscar Méndez、Alvaro Agea重点介绍Stratio的主要客户、为什么使用Cassandra、为什么使用Spark以及举例说明。
利用Spark and Shark快速循环分析不同数据 ClearStory Data创办人Vaibhav Nivargi专注于查询优化、高性能数据处理和分布式系统。他是Aster Data的第一个工程师,开发Aster MapReduce平台的关键部分。他的经验包括优化Linux内核的多核处理器和分布式文件系统。Vaibhav毕业于斯坦福大学计算机科学