我一直在研究如何从大(> 300MB)PDF文件中提取图像。我正在使用pdfbox,但由于某些原因我无法弄清楚,有些页面没有正确提取。如何使用Java(不使用pdfbox)从pdf中提取图像
我使用PDFTo PDF图像类作为我的代码的基础。
所以,你知道另一个图书馆,可以帮助我做到这一点吗?我知道可能会使用iText,但我读到它不能用于商业产品。
我已经安装了软件包xpdf和xpdf-utils,并且名为pdfimages的实用程序工作正常。但是我需要从Java解决这个问题,它应该是可移植的。
您可以将xpdf-utils移植到Java。 – erjiang 2010-11-30 16:15:06
除非您购买商业许可,否则iText属于GPL。 – 2010-11-30 16:16:41
我会尝试使用版本<5,我认为对版本> = 5,许可条款的更改已更改。 – 2010-11-30 16:56:17