textract 是一个 Python 库,用来从各种文档中提取文本信息。
示例代码:
# some python file import textract text = textract.process("path/to/file.extension")