-1
我正在做一个与分析相关的项目。为此,我需要从MS WORD中统计一些行的值。如果它是.docx扩展名,那么对我来说没有问题,但是当它是一个.doc扩展名时,我不能假设读取这些文件。我能为此做些什么?我使用python 3.6并安装了.docx模块。期待一个好的答案。提前致谢!如何在Python中检索MS WORD(2003)doc文件
我正在做一个与分析相关的项目。为此,我需要从MS WORD中统计一些行的值。如果它是.docx扩展名,那么对我来说没有问题,但是当它是一个.doc扩展名时,我不能假设读取这些文件。我能为此做些什么?我使用python 3.6并安装了.docx模块。期待一个好的答案。提前致谢!如何在Python中检索MS WORD(2003)doc文件
你可以做到这一点使用win32com:
import win32com
from win32com.client import gencache, constants, Dispatch
# that's the magic part
gencache.EnsureModule('{00020905-0000-0000-C000-000000000046}', 0, 8, 3)
app = Dispatch("Word.Application.8")
# open a document
app.Documents.Open("MyDocument.doc")
现在你可以做任何你想要的这个文件。 如果与gencache行给你一个错误,那么你就需要通过执行先创建COM模块:
lib\site-packages\win32com\client\makepy.py
这会弹出,你需要选择“Microsoft Word对象库”的窗口。