让我们假设,我在Spark中有一个关键值对,如下所示。Pyspark(key,value)对与(key,[值列表])
[ (Key1, Value1), (Key1, Value2), (Key1, Vaue3), (Key2, Value4), (Key2, Value5) ]
现在我想减少这种情况,像这样。
[ (Key1, [Value1, Value2, Value3]), (Key2, [Value4, Value5]) ]
也就是说,从键值到键值列表。
我该怎么做,使用地图和减少python函数?
我相信这是你正在寻找的:https://stackoverflow.com/a/27002657/8160718 –