Python的大熊猫问题:如何对列值与列间匹配进行求和?
我有3列的表格:FROM_CITY,TO_CITY,Trip_Count和4行:
+-----------+---------+------------+ | From_City | To_City | Trip_Count | +-----------+---------+------------+ | Berlin | London | 2 | | London | Berlin | 3 | | Sydney | Tokyo | 4 | | Tokyo | Sydney | 6 | +-----------+---------+------------+
我要总结城市之间的旅行到具有2新表只有行:
+--------+------------+------------+ | City | Other_City | Trip_Count | +--------+------------+------------+ | Berlin | London | 5 | | Sydney | Tokyo | 10 | +--------+------------+------------+
我无法弄清楚如何在Python实现这一目标(最好在熊猫)。有什么建议么?谢谢!
注意:两个城市之间的顺序无关紧要。柏林 - 伦敦或伦敦 - 柏林都很好。
在SQL我可以做到以下几点,但我不知道怎么做相同的蟒蛇: '选择 至少(FROM_CITY,TO_CITY)的城市, 最大(FROM_CITY,TO_CITY)作为other_city, 总和(trip_count),如从行程trip_count 组由至少(FROM_CITY,TO_CITY),最大(FROM_CITY,TO_CITY) ' –