0
合并多行一些数据处理后,我结束了该数据集:变换星火Datset - 计数和ID
Dataset<Row> counts //ID,COUNT,DAY_OF_WEEK
现在我想这个转换为该格式,并保存为CSV:
ID,COUNT_DoW1, ID,COUNT_DoW2, ID,COUNT_DoW3,..ID,COUNT_DoW7
我能想到的一个办法:
JavaPairRDD<Long, Map<Integer, Integer>> r = counts.toJavaRDD().mapToPair(...)
JavaPairRDD<Long, Map<Integer, Integer>> merged = r.reduceByKey(...);
当它一对“ID”的名单和大小的7 获得JavaPairRDD后,我可以将其存储在csv中。没有将其转换为RDD,是否有更简单的方法进行转换?