1
我试图通过星火两列做组和正在使用reduceByKey如下:reduceByKey在星火两列
pairsWithOnes = (rdd.map(lambda input: (input.column1,input.column2, 1)))
print pairsWithOnes.take(20)
上述地图命令工作正常,并产生三列,第三个是所有那些。我试图通过前两列求和的第三如下:
reduced = pairsWithOnes.reduceByKey(lambda a,b,c : a+b+c)
print reduced.take(20)
然而,在运行最后的印刷指令抛出一个错误“太多值解压”。有人能以正确的方式引导我将其减少两列吗?
你能提供例如输入和预期的输出? – zero323