2017-02-08 32 views
1

当我查看数据框中列中的值时,可以看到由于用户数据输入错误导致同一类别输入错误。Python熊猫替换列中的值

对于我的数据框我用这个代码:

df['column_name'].value_counts() 

输出:

Targeted 523534 
targeted 1 
story  25425 
story  2 
multiple 2524543 

有关的故事,我想有一个空间?

我试图用目标取代目标。

df['column_name'].replace("targeted","Targeted") 

但是没有发生,我仍然得到相同的数值。

+0

你有没有'DF [ 'COLUMN_NAME' ] .replace( “目标”, “目标”)。value_counts()'? – Zero

回答

1

是的,似乎有开始的结束空白区(s)。

需要str.stripSeries.replaceSeries.str.replace

df['column_name'] = df['column_name'].str.strip().replace("targeted","Targeted") 

df['column_name'] = df['column_name'].str.strip().str.replace("targeted","Targeted") 

另一种可能的解决方案是将所有字符转换为小写:

df['column_name'] = df['column_name'].str.strip().str.lower() 
+0

谢谢你,这个选项工作最好的df ['column_name'] = df ['column_name']。str.strip()。replace(“targeted”,“Targeted”) – jeangelj