2014-09-21 129 views
3

是否有可能通过使用Tesseract OCR来OCR图片并识别不同的字体大小的图片。如果是,我是否需要使用任何其他第三方库或可以使用纯Java。例如,检测Tesseract OCR Java实现的大小字体大小

我想通过使用字体大小来检测报纸的标题和内容。

任何关于此事的帮助将不胜感激。

回答

0

Tesseract的hOCR输出包括可用于确定大小的行和字的边界框,并且可以通过打开配置变量hocr_font_info来配置字体的点大小。