如何解析PDF文件并使用Java将文件写入word文件?解析PDF文件并使用java编写word文件中的内容
7
A
回答
9
对于Java中解析PDF文件,你可以使用Apache PDFBox的:http://incubator.apache.org/pdfbox/
读/写在Java中Word(或其他Office)的文件格式,尝试POI:http://poi.apache.org/
两者都是免费的。
3
5
尝试iText Java库:
iText的是开发人员希望加强与动态PDF文档生成和/或操纵 Web和其他应用的理想库。
它可以用于您的解析步骤。
至于生成Word文档 - OpenOffice Java API可能能够生成与Word兼容的文档(对此API没有个人经验)。
0
如果源PDF主要是文本,则可以使用iText。解析时很难处理图像等。如果只是文本,就像10行代码一样简单。有关示例,请参阅iText手册。
对于编写word文件,只有Apache POI。弄清楚可能有点棘手,但对于这样一个简单的任务来说,它不应该是任何问题。
或者,您可以使用docx4j来编写docx。像POI一样,它是免费的。 – JasonPlutext 2010-11-17 03:28:45