train['finally'].head(5)
0 [0, 0, 0, 0, 3, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, ...
1 [0, 0, 0, 4, 0, 0, 0, 5, 0, 0, 6, 0, 0, 0, 0, ...
2 [0, 0, 0, 0, 0, 0, 0, 3, 0, 0, 0, 0, 0, 0, 0, ...
3 [2, 0, 7, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, ...
4 [0, 0, 0, 0, 7, 0, 0, (3, 1), 0, 0, 0, 0, 0, 0...
我想使用它使用此列
我用这个
visits_df = train['finally'].apply(lambda x: pd.Series(str(x).split(',')))
这
试图建立一个独立的熊猫数据帧中的大熊猫列df = pd.DataFrame(train.visits.str.split(' ').tolist())
我试着在逗号和空格分开,b UT斯达康同样的结果
但问题是,有柱子里面的一些元素是元组这样的(3, 1)
我试图在逗号和空间拆分,但相同的结果。
0 [0 0 0 0 3 0 0 0 0 0 ... 0 2 3 0 0 0 0 0 0] NaN
1 [0 0 0 4 0 0 0 5 0 0 ... 6 0 0 4 0 0 (2 4) 0 0]
2 [0 0 0 0 0 0 0 3 0 0 ... 5) 0 3 0 0 0 0] NaN NaN NaN
3 [2 0 7 2 0 0 0 0 0 0 ... 0 0 5 0 0 6 0 0] NaN NaN
4 [0 0 0 0 7 0 0 (3 1) 0 ... 0 0 0 0 0 0 0 0 0 0]
它分裂成元组单独的列,我看到额外的列,应该只有143列
我该如何解决这个问题?
什么是列的数据类型? – mhawke
是个人项目实际上列出,以及(在这种情况下)是每一个列表的长度相同? – Evert