2010-11-19 107 views
9

我正在使用pisa,它是一个用于Python的HTML到PDF转换库。html to .doc转换器在Python?

对于Word文档是否存在相同的东西:一个HTML到.doc的Python转换库?

+0

你为什么要这样? MS Word可以读取HTML。 – MSalters 2010-11-19 15:08:53

+0

我有同样的问题:我有一个使用比萨转换为PDF格式的HTML,我想用word来做同样的事情。它是一个大的文档,大约20页,使用相同的代码生成html,然后通过比萨或其他东西导出会很好。 – 2012-06-12 17:24:05

+0

@Eric:最近,我遇到了同样的问题。只是想知道,你有没有找到一个解决方案将HTML转换为Word .docx?谢谢。 – 2013-04-08 21:42:23

回答

3

虽然我不知道一个直接的模块,可以让你转换这个的,但是:

  1. 您可以转换HTML纯文本首先使用html2text模块。
  2. 之后,您可以使用此python-docx模块将文本转换为docdocx文件。
9

你可以使用windows的pywin32 python扩展win32com,让MS Word为你转换它。一个简单的例子:

import win32com.client 

word = win32com.client.Dispatch('Word.Application') 

doc = word.Documents.Add('example.html') 
doc.SaveAs('example.doc', FileFormat=0) 
doc.Close() 

word.Quit()