这里是我心目中的问题,给定一个表如何分割一列到多列和计算频率
Id type
0 1 [a,b]
1 2 [c]
2 3 [a,d]
我想把它转换成形式:
Id a b c d
0 1 1 1 0 0
1 2 0 0 1 0
2 3 1 0 0 1
我需要一个非常有效的方式来转换大型表格。欢迎任何评论。
====================================
我已经收到了一些很好的答案,非常感谢你的帮助。
现在出现了一个新问题,这是我的笔记本电脑内存不足以通过使用pd.dummies
生成整个数据帧。
有无论如何生成一个行和堆栈然后在一起的稀疏矢量?
您是否知道'''事先可能发生的所有可能的值? – shanmuga
@shanmuga,是的,我可以事先快速计算所有不同的类型 –
您的'type'列是由字符串还是字符串列表组成? – DSM