0
在单词计数示例中,例如,映射后我有(python,1)
和(Python,2)
。我怎么能合并两成一个(python,3)
通过执行如下:PySpark - 如何将键与大小写忽略
def combine(a, b):
if a[0].lower() == b[0].lower():
return (a[0], a[1] + b[1])
然后我打电话
(sc.map(lambda word: (word, 1))
.reduceByKey(lambda a, b: a + b)
.reduce(lambda a, b :combine(a, b)))