我需要将Word文档转换为Java中的HTML文件。该函数将输入一个Word文档,而输出将是基于Word文档的页数的html文件,即如果word文档具有3页,则将生成3个具有所需分页符的html文件。
我搜索了可以将doc转换为html但没有结果的开源/非商业API。曾经做过此类工作的任何人都请帮助。
谢谢
我们使用tm-extractors,然后回到商业Aspose。两者都有本机Java API。
我建议使用JODConverter,它利用了OpenOffice,可以为当今可用的OpenDocument和Microsoft Office格式提供最佳的导入/导出过滤器。
JODConverter有很多文档,脚本和教程可以帮助您。