2016-07-29 100 views
0

我想读通过分隔TXT数据 '' 和 '\ T',我用下面的代码:大熊猫read_csv引发ValueError异常

io_df = pd.read_csv('input_output.txt',sep='\D|\t',engine = 'python')

这引发了以下错误信息:

--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-38-5ab0138d93ac> in <module>() ----> 1 io_df = pd.read_csv('input_output.txt',sep='\D|\t',engine = 'python')

如何解决这个问题?

回答

0

对我的作品sep=",|\t"

pd.read_csv('test.csv', sep=",|\t", engine = 'python') 

样品:

import pandas as pd 

df = pd.read_csv('https://dl.dropboxusercontent.com/u/84444599/test.csv', 
       sep=",|\t", 
       engine = 'python') 
print (df) 

    col col1 col2 
0 a d t 
1 d u l 
+0

谢谢你,这是确定的来解决这个问题。但是如果我想通过** regex **表达式分开,它总是会引发错误,如何解决? – Stellera

+0

这是非常难的帮助你,因为我没有你的文件。 – jezrael

+0

我认为最好的方法是使用小文件样本,尝试找出导致错误的原因,然后找到解决方案。 – jezrael