我试图创建我认为是一个简单的数据透视表,但我有严重的问题。有两件事我不能做:熊猫:枢轴为真/假,丢失列
- 摆脱最后的“伙伴”列。
- 如果每个公司都有该伙伴,则将值设置为True或False。
设置:
df = pd.DataFrame({'company':['a','b','c','b'], 'partner':['x','x','y','y'], 'str':['just','some','random','words']})
所需的输出:
company x y
a True False
b True True
c False True
我开始:
df = df.pivot(values = 'partner', columns = 'partner', index = 'company').reset_index()
这让我接近,但是当我TR要摆脱“合作伙伴”专栏,我甚至不能引用它,而不是“索引”。
对于第二个问题,我可以使用:
df.fillna(False, inplace = True)
df.loc[~(df['x'] == False), 'x'] = True
df.loc[~(df['y'] == False), 'y'] = True
但似乎令人难以置信的哈克。任何帮助,将不胜感激。
你想'df.assign(VAL = TRUE).pivot_table(值= 'VAL',索引值”公司',列='伙伴',fill_value =假)'? – lukeA
@lukeA - 是的,这正是我想要的。谢谢! – pshep123