2016-09-16 67 views
0

我有一个输入A,我将其转换为散布在群集中的rdd X火花处理数据混洗吗?

我对它执行某些操作。

然后我在输出rdd上做.repartition(1)

我的输出rdd是否与输入A的顺序相同。

火花会自动处理这个吗?如果是,那么如何?

+0

会是什么你做到了吗?为什么要将数据重新分区到单个分区? –

+0

@YuvalItzchakov必须在单个文件中打印输出。 – Azrael

回答