2016-11-30 176 views
0

大家好我正在试图做的是让python识别这张图片just the number 96 in a white background。并向我展示一串“96”,就是这样。如何使用python和OCR引擎识别图片中的数字?

Image of the number 96

对于我已经安装pytesseract到使用命令提示蟒该目的(PIP安装pytesseract),我也已经安装弼(这是枕现在,并且还使用命令提示安装),超正方体OCR引擎也安装在我的计算机上,我下载并安装它,位于我的环境变量(在命令提示符中键入path命令,它显示我为Tesseract-OCR),最后我还下载了pytesser,将文件解压缩到目录:C:\ Python27 \ Lib。几乎忘了提及,我拥有的Python版本是2.7.12,安装的OpenCV版本是3.1.0。 我所做的,就是运行以下脚本:

from PIL import Image 
import pytesseract 
img=Image.open('E:\Alex2016\Python OpenCV\Scripts\imagenFinal.jpg') 
a=pytesseract.image_to_string(img) 
print(a) 
img.show() 

而且只显示我的形象,但没有“96”字符串。我对这个人很陌生,我甚至不知道我是否真的使用了Tesseract-OCR,我知道这是一个超级强大的引擎。我在python shell中运行我的脚本。我不得不提到pytesser的工作原理,因为当试图“导入pytesser”或者像从其他网站中看到的那样“从pytesser导入*”时,我得到这个错误

import pytesser ImportError: No module named pytesser

我觉得这个图像很容易理解和嘈杂的自由,所以如果你能告诉我如何使用这些工具检测数字,或者如果有任何其他可以做到这一点,非常感谢你的时间家伙我这个东西是新的,但我真的对这个科学领域的计算机视觉技术感兴趣。

+0

我在一台Windows 10,64位机器 –

+0

脚本无法导入pytesser,请先尝试这个http://stackoverflow.com/questions/15567141/installing-pytesser – Aleksandar

+0

谢谢亚历山大,我已经尝试了所有的建议在链接中,但没有结果。我创建了一个PYTHONPATH,将它添加到我的Path变量中,而没有任何东西。同样将tesseract.py文件重命名为__init__.py并且没有任何内容,仍然会出现相同的错误。 –

回答

-1

我认为错误出现在print(a)中,因为您使用的是Python 2.7,在这种情况下打印功能的正确语法是print a

+0

您可以在2.7中使用'print a'和'print(a)' – Scott