1
我需要在列表上执行reduceByKey
。什么是最快的解决方案?我正在使用:::
运算符合并2列表中的减少操作,但:::
是O(n),因此恐怕减少操作将最终成为O(n )。spark减少使用scala减少列表时的性能/复杂性
代码示例:
val rdd: RDD[int, List[int]] = getMyRDD()
rdd.reduceByKey(_ ::: _)
什么是最好/最有效的解决方案?