2017-04-08 86 views
1

有关示例数据帧scholor阿帕奇火花AGG()函数

scala> scholor.show 

| id| name|age|sal|base| 

对于上面,下面都,给出相同的输出。那么将使用什么agg()呢。它只是为了名称。

scala> scholor.groupBy("age").sum("base").show  /*with out agg */ 

scala> scholor.groupBy("age").agg(sum("base")).show  /* with agg */ 
+---+---------+ 
|age|sum(base)| 
+---+---------+ 

是否agg()需要任何可变参数作为参数? 需要什么agg()

在此先感谢。

+0

你需要加入什么?结果是按年龄分组的基数之和。这已经是一个聚合。 –

+0

@JoostdenBoer:是的。总和,最小值,最大值,平均值等......已经是聚合函数。那么为什么dataframe api提供了agg()方法。我认为,这意味着什么....搜索的东西! – Raghav

回答

1

为了写.sum该方法具有存在。它在API上被硬编码。使用.agg您可以提供其他聚合功能,sum("column")只是其中之一。