2015-11-24 26 views
0

有没有办法让我通过突出显示所需的字段来扫描PDF图像并从图像中提取数据?我们每天扫描数以千计的房地产行为的PDF图像,并希望能够自动完成数据录入过程。我们面临的问题是没有两个行为是相同的。PDF数据提取

+1

你在这里新来的,因为我想念你遇到的代码和错误。请阅读如何问问http://stackoverflow.com/help/how-to-ask以及如何创建一个最小化,完整和可验证的示例http://stackoverflow.com/help/mcve。 – davejal

回答

0

它已在评论中说,Stackoverflow主要是关于编程问题。

尽管如此,根据实际文件和要处理的卷有可能。

在高端,有一种名为Teleform的产品,最初由卡迪夫开发,现在由惠普拥有,用于处理纸张表格;您还可以查看Business Process应用程序Cardiff LiquidOffice,现在是HP LiquidOffice。

在低端,我开发了一个PDF格式的应用程序,使用Acrobat运行,可以扫描和OCRd格式,并将数据传输到一个专门准备好的可填写表格,从那里可以将数据导出为数据库,例如。欲了解更多信息,演示和报价,请随时与我联系私下。

如果你想用Acrobat开发一些东西,你也可以从OCRd文档开始,然后使用Redaction函数的功能(或者使用Appligent的工业强度编辑工具Redax)来查找关键字,然后使用这些关键字的位置信息提取更多的数据。