2017-04-22 85 views
1

我有很多打印文档的右上角有12位数字。什么是使用应用程序或设备将这些数字扫描到新行中每个数字的单个文档的最快方法。任何其他解决方案的问题将不胜感激。将多个数字扫描到一个文档中

预先感谢您

+0

这些打印的文件数量很大,因此将它们扫描为PDF需要很长时间。如果我有PDF,我可以使用Adobe DC阅读器。我需要的是具有网络摄像头或智能手机的电脑上的软件,或QR或条形码阅读器般的设备,它可以即时扫描文档中的内容 –

+0

任何要显示的示例文档?您可以隐藏除数字区域之外的信息。 OpenCV和Tesseract可以使用正确安装的摄像头作为视频扫描仪来完成这项工作。 – thewaywewere

+0

不是代言,只是一个建议http://www.irislink.com/EN-GB/c973/IRISPen-Executive-7---Pen-scanner.aspx –

回答

0

有一个叫Kantu已经做了你需要什么,PDF scraping with OCR的软件组件。因此,您的代码会将PDF发送到Kantu,并将数字返回给您的代码。

You create a template (mark the area of the the invoice where the number is) and Kantu extracts this number.

创建模板(=在这里你标记出的发票号码是发票的面积小图像)和Kantu提取这个数字。

另一种选择是通过使用OCR软件(如Tesseract)或在线API(如OCR.space(支持PDF)或Google Cloud Vision)自行构建类似内容。

0

基于该文档样本,可能的解决方案是使用与PythonOpenCV,或pallowtesseract实施若干扫描应用程序。

  1. 使用网络摄像机来录制文件并捕获帧图像。
  2. 裁剪感兴趣的区域,即只有12位数字的右上角区域。
  3. 传递裁剪后的图像用于OCR。
  4. 将扫描的号码追加到文件中。

希望得到这个帮助。