我是新的斯卡拉和火花并试图了解这里几个基本的东西。斯卡拉返回值计算在foreach
使用Spark版本1.5。
为什么sum的值在以下foreach循环中没有得到更新。
var sum=1;
df.select("column1").distinct().foreach(row=>{
sum = sum +1
})
println("SUM = "sum)
- >SUM = 1
我想了解什么变量的范围称为中的for-each。如果我需要在内部进行一些数学运算并在for循环外获得结果,该怎么办?
上面的理解我的用例是在循环中获取唯一值并将其附加到String列表中。
你应该提到你不仅在标签中使用Spark,因为它很重要。这对于Scala系列非常适用。 –