这是我试图使用熊猫读取的数据文件的示例。所有的文件都有不同数量的注释行,但是所有文件都以BEGIN
开始数据部分,并以END
结尾,并且可能在此之后换行。 读取CSV与熊猫并处理评论
!Example data file
!With commands delimited by exclamation points
!Not always the some number of comment lines
BEGIN
300,-1.0342501,-0.07359
5298,-0.9889674,0.06514
1029,-0.981307,0.130398
1529,-0.971765,0.1945281
END
这是我在这些文件中读取大熊猫。
b = pd.read_csv(data_file,,names=['Frequency','Real','Imaginary'],comment='!')
有我有两个问题,第一个是它读取所有行,只是填补了注释行也只是无或NaN的并读取BEGIN
和END
标签。这也导致了单元格索引的偏移,这是我的第二个问题。
什么是正确的熊猫阅读此数据框与删除注释行和BEGIN
和END
标签?有没有一种优雅的代码可以解决我的两个问题?
此代码不适用于我的示例数据。它给出错误“CParserError:错误标记数据。C错误:预计在第5行的1个字段,看到3” – BKay 2014-08-29 00:48:38
你使用的是什么版本的熊猫?我有0.14.1。 – 2014-08-29 01:32:30
我有版本14.0的熊猫。 – BKay 2014-08-29 10:15:03