大数据组件Spark面试题Spark高频面试题
近几年在大数据领域Spark还是比较火的它可以快速计算大量数据TB甚至PB级别因为它是基于内存的计算比MapReduce更快更灵活.不过Spark使用的不好也会很慢平时在使用的时候需要特别了解Spark的各项组件参数调优等否则很容易就造成数据倾斜.里面有Spark的部署方式spark core spark sql spark streaming等组件的各种面试题包括但不限于宽窄依赖缓存数据广播shuffle以及数据倾斜的查看和解决方式等等对于大数据离线在线面试的同学还是很有帮助的
暂无评论