2017-05-26 164 views
0

我试图将Excel文件读入pandas,但是我收到消息format and extension of the file don't match将csv文件读取到熊猫

当我尝试使用read_excel时,出现错误消息,因此我使用read_csv

这是问题所在;我的“Excel的像”文件中有一些行的空白单元格,并创建一个奇怪的东风,一些领域的转移:

Image 1

我的代码如下:

2010 = pd.read_csv(r'{0}\\file.xls'.format(path_temp),sep = 
r'\t*',encoding='iso-8859-2') 

在输出中,列Outcome出现在第8行数据帧的第6(日期4)列中。您是否知道解决方法?我需要每15分钟自动加载一次这个文件,这意味着我想避免手动打开并保存为excel

+0

你可以发布示例文件吗?使用'read_excel'打开它时出现什么错误信息? – EFT

+0

它表示不支持的格式或损坏的文件。预期转炉等... – Jsfouf

+0

如果您在文本编辑器中打开它,它会是什么样子? – EFT

回答

0

您的分隔符是一个正则表达式。 sep=r'\t*'匹配任意数量的连续制表符,所以应将空白单元格视为单个分隔符。改为尝试sep='\t'

+0

非常感谢,这对空单元格起作用!我 – Jsfouf

+0

我知道有一些单元格包含引号的内部问题。尽管使用了quotechar ='“'参数,那些----会创建一个换行符 这里是我的代码:pd.read_csv(r'{0} \\ DonneesIndisponibilitesProduction_2017.xls'.format(path_temp),delimiter = r'\ t',encoding ='iso-8859-2',quoting = csv.QUOTE_ALL,quotechar ='“') 我错过了什么吗? – Jsfouf