2009-07-28 94 views
0

是否有可用于读取PDF文档并将数据转换或导出到Excel文档的示例代码或实用程序?从PDF中提取数据并导入到Excel .NET

我在搜索时看到的大多数示例代码都将Excel转换为PDF。

+0

免费下载我发现了一些pdfbox的实用工具,我使用dll从pdf文件中提取文本。 – Batuta 2009-07-30 02:26:39

回答

1

问题是,PDF可能不会保留任何电子表格类型结构 - 它只是在页面上绘制的文本。所以你不可能对结果满意,除非它是一个非常简单的页面。

0

您唯一真正的选择是寻找第三方解决方案。我怀疑你会找到一个免费的SDK,它可以让你做到这一点,原因很简单,这并不容易。我会检查出Solid Documents和可能的一些Investintech's solutions

较新版本的Acrobat还提供了一些更高级的PDF到Excel提取功能,因此Adobe's PDF Library SDK也值得一看。

1

您可以用pdfsharp提取数据并使用openxml sdk创建一个excel文件。这样你就能得到你想要的东西。这将需要一些工作,但不需要Excel或Acrobat或任何花费金钱。

优点:

  • 免费
  • 没有Excel对象模型
  • 只使用库
  • 你得到你想要什么

缺点:

  • 需要花费时间对代码进行编码
1

我创建了一个解决方案,它使用开源XPDF和VBA的组合将多个PDF文件的数据以结构化格式导入到Excel中。它通过指定开始和结束文本模式并使用可选替换提取文本以清理输出来工作。该解决方案可以从http://www.business-spreadsheets.com/forum.asp?t=884