删除熊猫数据框中的特殊字符

我已经找到了关于如何完成这些操作的信息，但没有任何工作可以帮助我。我试图替换特殊字符'ð'。我从csv文件导入了我的数据，并使用了encoding ='latin1'，否则我不断收到错误。然而，一个简单的DF ['Column']。str.replace（'ð'，''）不会做到这一点。我也尝试解码并使用在另一篇文章中推荐的那个字符的十六进制值，但这仍然不适用于我。非常感谢帮助，如果需要，我愿意发布代码。删除熊猫数据框中的特殊字符

来源

2017-08-24 SKlein

呼叫str.encode其次str.decode：

df.YourCol.str.encode('utf-8').str.decode('ascii', 'ignore')

如果您想为多列做到这一点，你可以切片，并呼吁df.applymap：

df[col_list].applymap(lambda x: x.encode('utf-8').decode('ascii', 'ignore'))

请记住，这些操作不到位。所以，你必须将这些列分配回合适的位置。

来源

2017-08-24 22:20:17

谢谢！那究竟做了什么？我只想专门摆脱'ð'而没有别的。 – SKlein

它清除每个非ascii或加重字符的数据帧。 –

删除熊猫数据框中的特殊字符

回答

相关问题