2008-09-05 62 views

回答

4

您可以使用Windows内置的IFilter接口从任何支持的文件类型中提取文本和属性(作者,标题等)。这是一个COM接口,所以你可以使用.NET interop工具。

您还必须从Adobe下载免费的PDF IFilter驱动程序。

0

这里是一个很好的列表: Open Source Libs for PDF/C#

大多数的这些都是为了向创建PDF,但他们应该已经阅读能力以及。

有这一个还有:iText

我只用iText的前播放。没什么大不了

0

添加到批准的答案:有交替的商业解决方案,以替代的Adobe IFilter的文本索引(提供类似的API,而且还要附加保费的功能):

  1. Foxit PDF IFilter:提供更快的文本索引比较Adobe的插件。
  2. PDFLib PDF iFilter:包含对受损PDF文档的支持以及额外的API来运行您自己的查询。

如果你正在寻找一个工具,可以从两个托管的.NET应用程序和继承的编程语言像传统的ASP或VB6中使用,那么这是在商业ByteScout PDF Extractor SDK将适合,因为它同时提供了.NET和ActiveX/COM API。

声明:我为ByteScout工作