我想将HTML页转换为MS字。我想知道什么API会有帮助,并且如果有其他选项可以做同样的事情。 整个页面将被转换为.doc(例如,如果html页面中有表格,则必须在word doc中创建类似的表格)。 Apache POI不提供格式化单词文档的选项,如HTML页面中所示。 我需要一些可以给我一个完全格式化的word文档的东西。使用java或任何API将HTML页转换为MS字
我寻求的一些东西是JSOUP
,docx4j
,jasper reports
和JOD Convertor
。
我试着用JSOUP解析HTML页面,并在我的java程序中得到了页面的内容 。现在我需要将这些内容传递给 doc/docx文件。 docx4j可以帮助获取格式化的docx文件吗?
请大家帮忙。 谢谢。
可能出现的重复[用Word以编程方式将Word文档转换为HTML](http://stackoverflow.com/questions/227236/convert-word-doc-to-html-programmatically-in-java) – 2012-03-05 11:57:38
将文件重命名为.DOC。有用。 – 2012-03-05 12:07:16
@AndreiBodnarescu:感谢您的链接。通过它。我希望它有助于 – 2012-03-05 12:10:20