我需要OCR从大多数已知布局的标签中获取一些特定信息。数据的来源是我知道的照片,可能会很棘手。数据可以是条形码(简单),短文本(大部分可以随着时间重复学习的已知单词)和数字(设置格式和长度)。从照片中裁剪和OCR标签
我已经做了一些研究,看来Tesseract可以在多个平台上做我想做的事情,但我有几个问题。
1)如何裁剪只有相关的标签。很久以前,我为一门大学课程做了一些非常基本的信号处理。我想这不是太困难。任何好的图书馆呢?
2)由于我知道布局,有没有办法根据每个具体的 值所需的部分对标签进行OCR?
3)预处理图片的其他技巧?
4)Tesseract是否是正确的工具?
添加一些示例图片 –