0
我试图用pd.read_csv
加载csv文件,但我得到了以下的Unicode错误:的UnicodeDecodeError:“UTF-8”编解码器不能在3位解码字节的0xCC:无效延续字节
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcc in position 3: invalid continuation byte
我试图用pd.read_csv
加载csv文件,但我得到了以下的Unicode错误:的UnicodeDecodeError:“UTF-8”编解码器不能在3位解码字节的0xCC:无效延续字节
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcc in position 3: invalid continuation byte
不幸的是,CSV文件没有内置的信号字符编码方法。
read_csv
默认猜测CSV文件中的字节表示以UTF-8编码编码的文本。如果文件使用的其他编码导致的字节不是有效的UTF-8序列,则会导致UnicodeDecodeError
。 (如果他们碰巧碰巧是有效的UTF-8,你不会得到错误,但你仍然会得到错误的输入,非ASCII字符,真的会更糟糕。)
它已经到了给你指定在播放什么编码,这需要一些知识(或猜测)它来自哪里。例如,如果它来自西部安装的Windows上的MS Excel,它可能是Windows代码页1252,你可以阅读它:
pd.read_csv('../filename.csv', encoding='cp1252')
你能分享你的代码吗?这会让你更容易帮助你。 – Philip
这只是'pd.read_csv('../ filename.csv')'然后我得到这个unicode错误。谢谢! –