如何使用Python将PDF文件转换为HTML?
我只是在想Google会(或似乎会)对PDF文件建立索引的行为。
我的最终目标是设置Apache以显示PDF文件的HTML,因此,向该方向发展的任何事情也将不胜感激。
该poppler的包提供了一个实用PDF2HTML您可能能够使用。还有一个Python绑定到libpoppler。