关于使用python在Linux上将.doc,.ppt和.xls转换为纯文本的方法的任何建议?实际上,任何转换方法都是有用的。我已经考虑过使用Open Office,但是,我想要一个不需要安装Open Office的解决方案。
我将使用命令行解决方案(然后使用Python子过程模块从Python运行工具)。
可以在以下位置(以源代码形式)找到msword( catdoc ),excel( xls2csv )和ppt( catppt )的转换器:http : //vitus.wagner.pp.ru/software/catdoc/。
不能真正评论catppt的有用性,但是catdoc和xls2csv可以很好地工作!
但是请确保首先搜索您的发行版存储库…例如,在ubuntu上,catdoc只是一个不错的选择。