我实际上对于pyspark是新手,我正在尝试使用它进行一些数据操作。 我有一个数据帧像下面的例子: Trxn Cust_ID Group
3370 A 1
8809 C 2
3525 B 3
8260 A 3
6349 B 3
3359 C 3
3701 NULL 3
5572 NULL 2
2580 A 1
在这个DF,TRXN的是独特的和cust_id的可重
我想用非缺失项目的模态值替换列中的缺失值。 我已经成功地使用该功能查找字符串值的模式: def mode_str(col_name, prnt=False):
'''return modal value of column `col_name` as a string'''
from collections import Counter
c = Counter([