所以我遇到了一个速度问题,我有一个数据集需要多次聚合。一次汇总多个值
最初我的团队已经建立了三个累加器,并对数据运行一个foreach循环。沿
val accum1:Accumulable[a]
val accum2: Accumulable[b]
val accum3: Accumulable[c]
data.foreach{
u =>
accum1+=u
accum2 += u
accum3 += u
}
我想这些积累切换到聚集,这样我可以得到一个速度提升,并有机会获得蓄能器进行调试线的东西。我目前正试图找出一种方法来一次聚合这三种类型,因为运行3个独立的聚合速度要慢得多。有没有人有任何想法,我怎么能做到这一点?也许无法聚合,然后将模式匹配分解为两个RDD?
谢谢
是否要立即执行任意集合集? – zero323
@ zero323不,它是3个特定的聚合。只是其中一个与其他人有不同的类型。 –