2017-08-03 94 views

回答

3

不幸的是,CSV文件没有内置的信号字符编码方法。

read_csv默认猜测CSV文件中的字节表示以UTF-8编码编码的文本。如果文件使用的其他编码导致的字节不是有效的UTF-8序列,则会导致UnicodeDecodeError。 (如果他们碰巧碰巧是有效的UTF-8,你不会得到错误,但你仍然会得到错误的输入,非ASCII字符,真的会更糟糕。)

它已经到了给你指定在播放什么编码,这需要一些知识(或猜测)它来自哪里。例如,如果它来自西部安装的Windows上的MS Excel,它可能是Windows代码页1252,你可以阅读它:

pd.read_csv('../filename.csv', encoding='cp1252') 
相关问题