背景 Spark在对目标数据进行计算后,RDD格式的数据一般都会存在HDFS,Hive,HBase中,另一方面,对于非RDD格式的数据,可能会存放在像Mysql中这种传统的RDMS中. 但是写入过程中经常出现各种各样的问题, stackoverflow上有很多帖子: Error writing spark dataframe to mysql table JDBC batch insert performance 还有些其他的贴 - Using Apache Spark and MySQL for Data Analysis - spark 1.3.0 将d