我有一个基于Tesseract的非常简单的OCR应用程序。在识别 步骤之后,我还提供了一个用户验证步骤,在OCR错误的情况下允许更正 。为了改进用户界面,我打算在原始输入图像OCR-ed字符顶部绘制一个 矩形,并将其与OCR输出并排放置。为了达到这一点,我需要 识别字符的坐标。如何获取识别字符的坐标
我想是这样的,但它似乎给我废话
ETEXT_DESC output;
tess->Recognize(&output);
text = tess->GetUTF8Text();
现在,如果我访问输出 - >计,它给了我10,000以上某个值, 这显然是错误的,因为整个图像只有20个左右的字符。
我在正确的轨道上吗?我可以请一些方向吗?
如何通过编程获取该信息? – Haoest