2016-12-30 173 views

回答

2

使用Tika的任何特定要求。您可以使用专门用于文档转换的Apache POI & itext API或document4j API。

document4j例::

File wordFile = new File(...), target = new File(...); 
IConverter converter = ... ; 
Future<Boolean> conversion = converter 
           .convert(wordFile).as(DocumentType.MS_WORD) 
           .to(target).as(DocumentType.PDF) 
           .prioritizeWith(1000) // optional 
           .schedule(); 
+0

是啊其实我的项目只使用apache tika,我们不想使用一个更多的jar特别是这项工作,我认为必须有某种方式做到这一点,但没有得到任何在线支持 – Vipul

+1

Documents4j完美的作品,轻松和完美的转换。顺便说一句,你应该使用不是一个,但更多的罐子做这个特殊的工作。不要害怕包括更多的罐子到您的项目 – AMB

+1

不确定,我没有亲自尝试。但尝试下面的例子,而不是“HTML”尝试“pdf”输出。 https://gist.github.com/amferraz/bded9e9b28f416d20943 –