在Ubuntu操作系统上进行大数据分析,使用spark-2.1.0-bin-without-hadoop版本是个不错的选择。Apache Spark利用内存缓存和查询优化,支持快速的数据分析查询,可适用于不同规模的数据。其Java、Scala、Python和R语言的开发API,能够覆盖批处理、交互式查询、实时分析、机器学习和图形处理等多种工作负载。