2012-10-04 36 views
0

我需要OCR从大多数已知布局的标签中获取一些特定信息。数据的来源是我知道的照片,可能会很棘手。数据可以是条形码(简单),短文本(大部分可以随着时间重复学习的已知单词)和数字(设置格式和长度)。从照片中裁剪和OCR标签

我已经做了一些研究,看来Tesseract可以在多个平台上做我想做的事情,但我有几个问题。

1)如何裁剪只有相关的标签。很久以前,我为一门大学课程做了一些非常基本的信号处理。我想这不是太困难。任何好的图书馆呢?

2)由于我知道布局,有没有办法根据每个具体的 值所需的部分对标签进行OCR?

3)预处理图片的其他技巧?

4)Tesseract是否是正确的工具?

+0

添加一些示例图片 –

回答

1

我之前没有处理过Tesseract。但是,我们使用另一个名为leadtools的第三方工具包。该工具包可以识别条形码,文本和数字,然后将结果保存为文档格式。它可以满足您的要求,因为它提供了在要识别的文本周围绘制特定区域的方法,并且它有一些预处理图像的方法。 此外,它还提供了自动在您想要OCR的文件中查找区域的功能。欲了解更多信息,请登录Tutorial

+0

您应该提到,如果您为他们工作,leadtools不是免费的或公开的 – BBog