import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSparkContext; import java.util.Arrays; import java.util.List; /** * sample(withReplacement,fraction,seed) 算子 * 对RDD中的数据进行随机采样,会有误差。 * 第一个参数:boolean类型,表示产生的样本是否可以重复:false不重复,也就是不放回的取;t