我在目录中有多个图像并希望将其从图像转换为文本文件。我必须在终端上手动执行。这是头痛的过程。所以,我的问题是如何在包含图像的文件夹上运行我的代码。使用python在整个目录上执行Tesseract OCR
这里是终端命令将其转换成文本:
convert captcha.png -resize 200% -type Grayscale input.tif #instead of input.tif i want same file name so, i can recognise easily
tesseract -l eng input.tif output #output name as same as file name
使用pytesseract glob的与我 – n1c9
试过,但图像的文本结果是相当可怕的这个作品非常适合我。有什么办法吗? – wizard
使用'subprocess.call'在各种文件上调用shell命令,并使用glob查找文件名。 – n1c9