我收到一个CSV文件,其中,
是用于分隔字段的分隔符,但不幸的是附加的符号表示小数点(德文符号)。熊猫读取格式不正确的CSV
因此,某些行的列数将不同。奇怪的是,Excel会解析/读取文件。是否有可能在熊猫中读取这些文件?到目前为止,我只得到了类似的东西来
Error tokenizing data. C error: Expected 97 fields in line 3, saw 98
编辑
下面是一个小例子:
pd.read_csv(os.path.expanduser('~/Downloads/foo.csv'), sep=',', decimal=',')
与~/Downloads/foo.csv
文件与
first, number, third
some, 1, other
foo, 1.5, bar
baz, 1,5, some
当我加载内容数据在R
See spec(...) for full column specifications.
Warnung: 1538 parsing failures.
row col expected actual
1 -- 93 columns 97 columns
2 -- 93 columns 98 columns
3 -- 93 columns 97 columns
4 -- 93 columns 102 columns
5 -- 93 columns 99 columns
熊猫有这样的宽容模式吗?
你能发布一个可重现的样本数据集吗? – MaxU
完成。请参阅编辑。 –
这是数据的准确表示,因为每行只有一个可能受到影响的列? – DSM