我想查找“参考”列的重复值,然后保留仅复制来自“金额”列的最大金额列的找到的行。如何合并具有重复值的列并保留Python中不同列的最大值?
电流:
+----------+---------------------+---------+
| reference | amount | column3 | column4 |
+----------+---------------------+---------+
| test1 | 9 | 45 | ye |
| test1 | 200| 45 | agag |
| test1 | 1 | 45 | aaa |
| test2 | 99 | 45 | bbab |
| test1 | 11 | 45 | value |
+----------+---------------------+----------+
期望:
+----------+---------------------+---------+
| reference | amount | column3 | column4 |
+----------+---------------------+---------+
| test1 | 200| 45 | agag |
| test2 | 99 | 45 | bbab |
请分享对这种情况的线索。
什么你的数据格式和你到目前为止做了什么? – Kasramvd
请告知您正在使用哪种数据类型。你基本上可以使用group by,并从每个组中找到最大值。 – vdkotian
这是一个csv文件。我试图找到重复的行。我会继续挖 – serte