是否有可能通过使用Tesseract OCR来OCR图片并识别不同的字体大小的图片。如果是,我是否需要使用任何其他第三方库或可以使用纯Java。例如,检测Tesseract OCR Java实现的大小字体大小
我想通过使用字体大小来检测报纸的标题和内容。
任何关于此事的帮助将不胜感激。
是否有可能通过使用Tesseract OCR来OCR图片并识别不同的字体大小的图片。如果是,我是否需要使用任何其他第三方库或可以使用纯Java。例如,检测Tesseract OCR Java实现的大小字体大小
我想通过使用字体大小来检测报纸的标题和内容。
任何关于此事的帮助将不胜感激。
您可以使用ResultIterator.WordFontAttributes API方法(example in Java using Tess4J)来检索识别文本的字体信息,包括字体名称和大小。
Tesseract的hOCR输出包括可用于确定大小的行和字的边界框,并且可以通过打开配置变量hocr_font_info
来配置字体的点大小。