0
如何查找存储在单元格中的列表的最小值? 我可以做一个UDF,但它感觉像一个矫枉过正。 min
功能从pyspark.sql.functions
只适用于组(这是groupBy的结果)。PySpark列表的最小值
min_ = udf(lambda inarr: min(inarr), IntegerType())
myDataFrameWithMin = myDataFrame.withColumn('min_value', min_(F.col('position_list')))
有没有办法根本不使用udfs? – ashim