Pyocr 是 OCR 引擎的简单 Python 封装,支持 Tesseract 和 Cuneiform 等。支持 Python 2.7 和 3.x,要求 Pillow。
示例代码:
import Image import sys from pyocr import pyocr tools = pyocr.get_available_tools()[:] if len(tools) == 0: print("No OCR tool found") sys.exit(1) print("Using '%s'" % (tools[0].get_name())) tools[0].image_to_string(Image.open('test.png'), lang='fra', builder=TextBuilder())