从照片中裁剪和OCR标签

我需要OCR从大多数已知布局的标签中获取一些特定信息。数据的来源是我知道的照片，可能会很棘手。数据可以是条形码（简单），短文本（大部分可以随着时间重复学习的已知单词）和数字（设置格式和长度）。从照片中裁剪和OCR标签

我已经做了一些研究，看来Tesseract可以在多个平台上做我想做的事情，但我有几个问题。

1）如何裁剪只有相关的标签。很久以前，我为一门大学课程做了一些非常基本的信号处理。我想这不是太困难。任何好的图书馆呢？

2）由于我知道布局，有没有办法根据每个具体的值所需的部分对标签进行OCR？

3）预处理图片的其他技巧？

4）Tesseract是否是正确的工具？

来源

2012-10-04 netterdotter

添加一些示例图片 –

我之前没有处理过Tesseract。但是，我们使用另一个名为leadtools的第三方工具包。该工具包可以识别条形码，文本和数字，然后将结果保存为文档格式。它可以满足您的要求，因为它提供了在要识别的文本周围绘制特定区域的方法，并且它有一些预处理图像的方法。此外，它还提供了自动在您想要OCR的文件中查找区域的功能。欲了解更多信息，请登录Tutorial

来源

2012-11-01 15:22:52

您应该提到，如果您为他们工作，leadtools不是免费的或公开的 – BBog

从照片中裁剪和OCR标签

回答

相关问题