2017-09-26 100 views
0

我使用Python 2.7的openpyxl来打开并修改现有的.xlsx文件。这个excel文件有大约2500列和10行。问题是openpyxl花了很长时间来加载文件(差不多1分钟)。无论如何加快了openpyxl的加载过程。从其他线程,我发现了一些read_only和write_only的提示。但是我必须同时阅读和写作excel,所以我不能将这些技巧应用于我。有没有人有任何建议。非常感谢你Openpyxl加载现有的Excel需要太长时间

+0

不是真的,但它可能取决于文件中的其他内容。 25000个单元格的加载速度非常快,但是您可能还会在文件中加载其他项目。 –

回答

-1

我不知道你需要用Excel文件做什么,但我会尝试打开.xmls文件作为熊猫据帧:

import pandas as pd 
df = pd.ExcelFile('file path') 
+0

Pandas Excel的支持受xlrd支持的限制,这只是文件格式的一个子集。 –

+0

使用熊猫打开偏离过程更快,但打开后我必须读取所有单元格(逐个单元格)并将注释写入excel for severals单元格(而不是逐段或逐列)。熊猫可以吗? – leanh2

0

我有什么做用蟒打开excel文件(超过2k列,大约2.5MB),然后将excel中的值与几个.xml文件中的值进行比较。差异将作为excel中的注释写入。 在Excel中只有文本,数字和一些格式(单元格背景颜色)。我将尝试删除excel中的所有格式以查看它是否加快了openpyxl的加载速度。

+0

我在python中做了一个简单的测量。用xlrd打开这个excel文件花了4秒,用openpyxl 22.5秒。是openpyxl如此缓慢 – leanh2