0
我有一个这样的数据表。熊猫:创建重复的行,修改某些列
A B1 B2 B3 C
3 1 2 0 'foo'
5 1 4 5 'bar'
7 0 3 0 'baz'
8 0 0 0 'foo'
我想创建一个看起来像这样一个新的数据表:根据以下规则
A B C
1.5 1 'foo'
1.5 2 'foo'
1.67 1 'bar'
1.67 4 'bar'
1.67 5 'bar'
7 3 'baz'
8 0 'foo'
:
- 如果没有
B#
列为零,创建一个A
不变的新行,并且B = 0
。 - 如果
B#
列n >= 1
是零,则创建新n
行,每行A
改为A/n
和B
等于非零B#
列之一。
C
独处。我不关心新行的顺序。我正在处理的实际数据表是几十兆字节,所以如果可能的话,我宁愿避免不必要的重复复制的解决方案。