2017-03-16 138 views
2

我的目标是在Windows 7机器上使用Tesseract在Python 2.7中使用OCR,但是我遇到了与安装过程相关的问题。我试着按照指令here,但“tesseract-core-yyyymmdd.exe”和“tesseract-langs-yyyymmdd.exe”的链接不再存在,我无法在网上找到这些.exe文件。这是我迄今为止所做的:Python:为Windows 7安装Tesseract

  1. 从官方tesseract-ocr页面的可执行文件安装了tesseract。
  2. 通过pip包“魔杖”,“PIL”,“pyocr”安装。现在

,如果我这样做在Python如下:

from wand.image import Image from PIL import Image as PI import pyocr import pyocr.builders import io

没有问题加载了这些包,但pyocr.get_available_tools()给我一个空列表。我相信这与上面缺少的安装.exe文件有关。我可以在哪里找到它们?我错过了什么?

回答

0

我只是试图设置pytesseract,它的工作原理!我安装了Windows 10和Python 2.7。

所有你需要做的:

  1. 下载Visual基本的C++从http://aka.ms/vcpython27并安装它通过此链接https://pypi.python.org/pypi/pytesseract

  2. Unizip文件(常见的安装步骤)从蟒蛇

  3. 下载正方体。

  4. 进入该目录包含了unizip文件

  5. 运行此命令,如果它的安装“蟒蛇的setup.py安装”

  6. (附加)来测试,去你的Python程序,并运行这个命令“import pytesseract”

我希望它的作品!请注意pytesseract是基于谷歌的OCR,它与tesseract类似。