2013-10-21 49 views
1

我在我的项目中使用poppler进行pdf到html转换。有没有其他的第三方插件可以将给定的PDF文档转换为HTML并提高转换质量?我们可以使用apose.PDF java库实现pdf转换为html转换吗?PDF到HTML转换使用aspose.PDF java库?

回答

2

检出JPedal,它能够将PDF转换为HTML。我最近不得不将它用于另一个用例,结果非常好。它非常好地处理嵌入的字体。不幸的是它不是免费的。

另一个很棒的(免费)PDF库是IcePDF,它是免费的,但afaik它只能提取文本/图像或渲染PDF图像,但结果非常漂亮。

1

退房pdfBox 如果你想有一个开源one.It提供了良好的提取工具。我建立用于提取文本和图像到现在为止,并很好地工作。