2011-04-28 120 views
0

是否有免费的方式通过VBA阅读PDF文件来提取基本的文字内容?我需要在我的公司每周自动执行一次数据采集流程,其中数据包含在PDF文件中(数据提供商每周更新一次)。另外,有没有一个参考可以用来了解PDF的文件结构(DOM?)?免费阅读PDF文件库

回答

3

Adob​​e的PDF参考是在线浏览:http://www.adobe.com/devnet/pdf/pdf_reference.html

我不知道要直接读取从VBA PDF文件的最佳方式,但如果你可以调用外部Java或C#程序,那么我会建议使用iTextbasic text extraction

编辑:我也许应该提到Adobe的PDF参考是一个800页的野兽。我发现查找特定问题的答案(例如,存储嵌入式truetype字体的宽度)很有用,但它可能不是一个好的开始。为此,阅读iText book帮助我开始了格式。

+4

可能值得一提的是,iText/iTextSharp不是免费的(除非在开源项目中使用)。 – Bobrovsky 2011-04-28 18:03:33

1

该IText书包含大量的一般PDF任务和大量的背景信息,以帮助您了解PDF文件的工作示例。它不仅仅是为自己付出代价!