我想使用pd.read_csv读取csv文件。我遇到了编码问题,我不知道如何继续。我遇到的第一个问题是在读取包含μ字符的csv fiels时导致的以下错误消息。 “SyntaxError:第4行文件GUI_Simpilify.py中以'\ xb5'开头的非UTF-8代码,但未声明编码;有关详细信息,请参阅http://python.org/dev/peps/pep-0263/“pd.read_csv不知道如何确定我的csv文件的编码
我能够通过手动更改文件名并删除μ来获取此错误。但是,这不是一个解决方案,因为我有1000个csv文件来提取数据。
一旦我手动从一个CSV文件中删除μ,并重新运行我的剧本我收到此错误信息: “的UnicodeDecodeError:‘UTF-8’编解码器不能在13位解码字节0xb1:无效的起始字节”
我相信这是因为我所有的csv文件都包含±和μ字符。 如何处理这些错误而无需手动解决方案?
代码:
import pandas as pd
test_csv = pd.read_csv('OFN 0.1pg_L Split 20-1 (5 fg on column).csv')
尝试:pd.read_csv(** **ü'OFN 0.1pg_L斯普利特20-1(5 FG上栏).csv格式) –
同时,你有没有考虑在没有姓名和循环的目录中键入。看看这里:https://stackoverflow.com/questions/10377998/how-can-i-iterate-over-files-in-a-given-directory –
csvs从哪里来?尝试明确指定编码,如'pd.read_csv('filename.csv',encoding ='utf8')',而不是'utf8',你可以尝试'cp1250'或'cp1252'来进行windows-like-encoding ,或''latin1'很常见。参考这里获取更完整的列表https://docs.python.org/3/library/codecs.html#standard-encodings –