2012-08-12 66 views
5

我有一个dataframe看起来像下面的变化值:大熊猫数据框 - 基于列标题

In [74]: data2 

Out[74]: 
      a b c 

2012-06-12 0 1 1 
2012-06-13 1 1 0 
2012-06-14 1 0 1 
2012-06-15 1 0 1 
2012-06-16 1 1 0 
2012-06-17 1 0 1 

有没有一种方法,使值=列标题,其中值= 1?

结果DF:

  a b c 

2012-06-12 0 b c 
2012-06-13 a b 0 
2012-06-14 a 0 c 
2012-06-15 a 0 c 
2012-06-16 a b 0 
2012-06-17 a 0 c 

然后删除= 0,使得DF降低到2列中的值: (列标题是不相关的,在这一点上)

结果DF:

  1 2 
2012-06-12 c b 
2012-06-13 a b 
2012-06-14 a c 
2012-06-15 a c 
2012-06-16 a b 
2012-06-17 a c 

回答

5
from pandas import * 
df = DataFrame([[0, 1, 1], [1, 1, 0], [1, 0, 1],], columns=['a','b','c']) 

foo = [] 
for i in df.index: 
    foo.append(df.columns[df.ix[i] == 1]) 
DataFrame(foo, index = df.index) 

将返回:

0 1 
0 b c 
1 a b 
2 a c 
6

您还可以召唤一些更深层次的大熊猫福,做:

In [28]: df.apply(lambda x: x.astype(object).replace(1, x.name)) 
Out[28]: 
      a b c 
2012-06-12 0 b c 
2012-06-13 a b 0 
2012-06-14 a 0 c 
2012-06-15 a 0 c 
2012-06-16 a b 0 
2012-06-17 a 0 c