2017-10-21 79 views
-1

我最近开始尝试用于Python的熊猫。我已经加载从EXCELL一个数据帧,其结果如下:大熊猫取而代之NaN

Datum Fotonummer Werkput Vlak Spoornummer Oriëntatie Onderwerp Fotograaf        
2011-05-16 1   1 1.0  1   N  Vlakfoto Spoor 1 DIM 
2011-05-16 2   1 1.0  1   N  Vlakfoto Spoor 1 DIM 
2011-05-16 3   1 1.0  1   N  Vlakfoto Spoor 1 DIM 

在某些点列“Spoornummer”包含由分隔的多个值“ - ”。

2011-05-16 24   1 1.0 12 - 13 - 14 - 15 - 16 N Vlakfoto Spoor 12 - 13 - 14 - 15 - 16 DIM 
2011-05-16 25   1 1.0 17 - 18     N Vlakfoto Spoor 17 - 18     DIM 
2011-05-16 26   1 1.0 17 - 18     N Vlakfoto Spoor 17 - 18     DIM 

我想用'|'代替' - '以便于在Neo4J数据库中使用,并试图使用:

df['Spoornummer'] = df['Spoornummer'].str.replace('-', '|') 

和其他变化,但无济于事。在执行命令时,整个'Spoornummer'列将获得NaN值。

Thx提前。

+3

无法重现 - 这对我的作品。 –

+2

该代码应该正常工作。您是否碰巧在其他尝试中将列清空,以便在空白列上运行该代码? –

+0

也适合我。 –

回答

-1

您可以使用sub()从重新并将其应用到每一行中科拉姆Spoornummer:

import re 
df['Spoornummer'] = df['Spoornummer'].apply(lambda x: re.sub("-", "|", x))