PDF数据提取

有没有办法让我通过突出显示所需的字段来扫描PDF图像并从图像中提取数据？我们每天扫描数以千计的房地产行为的PDF图像，并希望能够自动完成数据录入过程。我们面临的问题是没有两个行为是相同的。PDF数据提取

2015-11-24 C.Roddy

你在这里新来的，因为我想念你遇到的代码和错误。请阅读如何问问http://stackoverflow.com/help/how-to-ask以及如何创建一个最小化，完整和可验证的示例http://stackoverflow.com/help/mcve。 – davejal

它已在评论中说，Stackoverflow主要是关于编程问题。

尽管如此，根据实际文件和要处理的卷有可能。

在高端，有一种名为Teleform的产品，最初由卡迪夫开发，现在由惠普拥有，用于处理纸张表格;您还可以查看Business Process应用程序Cardiff LiquidOffice，现在是HP LiquidOffice。

在低端，我开发了一个PDF格式的应用程序，使用Acrobat运行，可以扫描和OCRd格式，并将数据传输到一个专门准备好的可填写表格，从那里可以将数据导出为数据库，例如。欲了解更多信息，演示和报价，请随时与我联系私下。

如果你想用Acrobat开发一些东西，你也可以从OCRd文档开始，然后使用Redaction函数的功能（或者使用Appligent的工业强度编辑工具Redax）来查找关键字，然后使用这些关键字的位置信息提取更多的数据。

2015-11-24 09:38:48

回答