2011-03-29 66 views
1

可能重复:
Export PDF pages to a series of images in Java开源库为PDF格式的图像转换

请建议可用于PDF文件的图像转换一些好的Java库。 我试过使用PDFBox:http://pdfbox.apache.org/,但在转换成图像后,我的pdf文档中的大部分文本在图像中出现乱码。它将'T'看作'Y','C'看作'#'等等。

以下是代码片段我用相同的:

PDDocument document = null; 
document = PDDocument.load(pdfFile); 
List pages = document.getDocumentCatalog().getAllPages(); 
for(int i=startPage-1; i<endPage && i<pages.size(); i++) 
{ 
    try 
    { 
    PDPage page = (PDPage)pages.get(i); 
    BufferedImage image = page.convertToImage(); 
    } 
} 
document.close(); 

我想这是有些问题,他们有渲染字体。 如果你觉得我可能在使用PDFBox时遗漏了某些东西,请告诉我。

请建议任何其他的替代方案。

我已经尝试使用jPedal:http://www.jpedal.org/它工作得很好,但它不是免费的,所以请建议所有关于此的好替代品。

回答