我在解决以下问题时遇到问题。 基本上我想找到哪个日期的特定项目(item_code
)被出售的最大和最小量。在火花数据帧中汇总多个列
输入数据帧
item_code, sold_date, price, volume
101, 10-12-2017, 20, 500
101, 11-12-2017, 20, 400
201, 10-12-2017, 50, 200
201, 13-12-2017, 51, 300
预计输出
查找max
和min
体积出售date.I希望这个解决方案,而无需使用任何lambda
操作。
df.groupBy("item_code")agg(min("volume"),max("volume"))
上面的人会帮助我获得max
和体积min
,但我希望他们有各自的日期。
我用udf试过了我最好的级别,但是我无法破解它。任何帮助高度赞赏。
请尝试发布文本样品而不是图像。谢谢。 – philantrovert
Thanks.Updated my post @philantrovert – BDR
它din帮助我。我想要在哪个sold_date,给定item_code的最大/最小音量。 first()将相同的日期返回给我的所有结果。 – BDR