0
这里的数据帧:如何删除每个组的记录数低于阈值?
id | sector | balance
---------------------------
1 | restaurant | 20000
2 | restaurant | 20000
3 | auto | 10000
4 | auto | 10000
5 | auto | 10000
如何找到每个sector
类型的计数和下面具体LIMIT
sector
型计数删除记录?
以下:
dataFrame.groupBy(columnName).count()
给了我一个值出现在该栏中的次数。
如何使用DataFrame API在Spark和Scala中执行此操作?