1
A
回答
0
有一个叫Kantu已经做了你需要什么,PDF scraping with OCR的软件组件。因此,您的代码会将PDF发送到Kantu,并将数字返回给您的代码。
创建模板(=在这里你标记出的发票号码是发票的面积小图像)和Kantu提取这个数字。
另一种选择是通过使用OCR软件(如Tesseract)或在线API(如OCR.space(支持PDF)或Google Cloud Vision)自行构建类似内容。
0
基于该文档样本,可能的解决方案是使用与Python
OpenCV
,或pallow
和tesseract
实施若干扫描应用程序。
- 使用网络摄像机来录制文件并捕获帧图像。
- 裁剪感兴趣的区域,即只有12位数字的右上角区域。
- 传递裁剪后的图像用于OCR。
- 将扫描的号码追加到文件中。
希望得到这个帮助。
相关问题
- 1. 使用WIA扫描多个文档
- 2. 使用C#将扫描文档读取到数据库字段
- 3. JAVA +扫描文档
- 4. 表扫描匹配其中一个字段 - 或多个语句
- 5. OCR文档扫描.NET SDK
- 6. Android文档扫描仪
- 7. 扫描多个文件标题
- 8. 如何将文档扫描整合到Qt应用程序中?
- 9. 扫描单个字符C
- 10. 如何将一个扫描仪用于整数和文本?
- 11. 扫描仪不会扫描一些字母文本文件
- 12. 一个接一个地计算多个正弦扫描
- 13. 一个Zend_Translate扫描翻译文件
- 14. 扫描一个目录树并将.csv文件读入一个数据框(Python)
- 15. Altbeacon - 扫描阵列中的多个UUID
- 16. 在多个类中使用扫描器
- 17. boost :: iostream zlib将多个文件压缩到一个存档中
- 18. 如何将多个文件夹压缩到一个存档中?
- 19. 扫描一个有效的整数
- 20. 扫描一个数字并返回输入流中的lexeme-Java?
- 21. SonarQube扫描仪在AST扫描期间卡在一个java文件中
- 22. 这是使用扫描仪扫描多个输入的方式
- 23. 如何扫描多个字符串的文本?
- 24. 扫描仪只是一个文件VS扫描仪用的FileReader和文件
- 25. Java的Web扫描到一个文本文件
- 26. 将中缀转换为Postfix时扫描多位数字
- 27. 如何将多个库档案(.a)打包到一个档案文件中?
- 28. 将字符扫描到C中的数组中
- 29. 扫描仪方法得到一个字符
- 30. 将文件扫描到嵌套结构
这些打印的文件数量很大,因此将它们扫描为PDF需要很长时间。如果我有PDF,我可以使用Adobe DC阅读器。我需要的是具有网络摄像头或智能手机的电脑上的软件,或QR或条形码阅读器般的设备,它可以即时扫描文档中的内容 –
任何要显示的示例文档?您可以隐藏除数字区域之外的信息。 OpenCV和Tesseract可以使用正确安装的摄像头作为视频扫描仪来完成这项工作。 – thewaywewere
不是代言,只是一个建议http://www.irislink.com/EN-GB/c973/IRISPen-Executive-7---Pen-scanner.aspx –