textract - Python 文本提取库


MIT
跨平台
Python

软件简介

textract 是一个 Python 库,用来从各种文档中提取文本信息。

示例代码:

# some python file
import textract
text = textract.process("path/to/file.extension")