3
我正在使用Google Cloud Vision API中的“TEXT_DETECTION”选项来OCR一些图像。Google Cloud Vision OCR API返回边界框/顶点的值不正确
围绕单个字符的边界框有时是准确的,有时不是,通常在同一图像内。
这是视觉算法的一个概率性质,Vision API中的一个错误,当然还有我如何解释响应的问题的正常副作用?
下面是具体的字母“a”我从中提取边框响应的一部分。
stdClass Object
(
[property] => stdClass Object
(
[detectedLanguages] => Array
(
[0] => stdClass Object
(
[languageCode] => en
)
)
)
[boundingBox] => stdClass Object
(
[vertices] => Array
(
[0] => stdClass Object
(
[x] => 419
[y] => 304
)
[1] => stdClass Object
(
[x] => 479
[y] => 304
)
[2] => stdClass Object
(
[x] => 479
[y] => 397
)
[3] => stdClass Object
(
[x] => 419
[y] => 397
)
)
)
[text] => a
)
Tim。感谢你的回应和链接,这应该是有用的。但是,我的问题是围绕字母的边框,而不是检测率或准确性。 –