List<Integer> data = Arrays.asList(1, 2, 3, 4, 5);
JavaRDD<Integer> distData = sc.parallelize(data);
Spark支持外部数据转换为并行化数据集合
JavaRDD<String> distFile = sc.textFile("data.txt");