第1章PythonSpark机器学习与Hadoop大数据11.1机器学习的介绍21.2Spark的介绍51.3Spark数据处理RDD、DataFrame、SparkSQL71.4使用Python开发Spark机器学习与大数据应用81.5PythonSpark机器学习91.6SparkMLPipeline机器学习流程介绍101.7Spark2.0的介绍121.8大数据定义131.9Hadoop简介141.10HadoopHDFS分布式文件系统141.11HadoopMapReduce的介绍171.12结论18第2章VirtualBox虚拟机软件的安装19