2017-10-17 107 views
-1

我正在做一个与分析相关的项目。为此,我需要从MS WORD中统计一些行的值。如果它是.docx扩展名,那么对我来说没有问题,但是当它是一个.doc扩展名时,我不能假设读取这些文件。我能为此做些什么?我使用python 3.6并安装了.docx模块。期待一个好的答案。提前致谢!如何在Python中检索MS WORD(2003)doc文件

回答

1

你可以做到这一点使用win32com:

import win32com 

from win32com.client import gencache, constants, Dispatch 
# that's the magic part 
gencache.EnsureModule('{00020905-0000-0000-C000-000000000046}', 0, 8, 3) 

app = Dispatch("Word.Application.8") 
# open a document 
app.Documents.Open("MyDocument.doc") 

现在你可以做任何你想要的这个文件。 如果与gencache行给你一个错误,那么你就需要通过执行先创建COM模块:

lib\site-packages\win32com\client\makepy.py 

这会弹出,你需要选择“Microsoft Word对象库”的窗口。