【发布时间】:2010-09-18 15:21:51
【问题描述】:
我需要将 Word 文档转换为 Java 中的 HTML 文件。该函数将输入一个word文档,输出将是基于word文档页数的html文件,即如果word文档有3页,那么将生成3个具有所需分页符的html文件。
我搜索了可以将 doc 转换为 html 但没有结果的开源/非商业 API。任何曾经做过此类工作的人请帮忙。
谢谢
【问题讨论】:
-
这里有一些起点。祝你好运。在 Microsoft 的网站上,您可以找到 .doc format 的文档,在 ECMA 网站上,您可以找到 .docx format 的文档。 Microsoft 在其 OpenXML 开发人员博客上有一个 category for Java,其中包括专门关于转换 OpenXML to XHTML in Java 的帖子。
-
theserverside.com/news/thread.tss?thread_id=41942#216880 -- 这对我来说之前效果很好
-
这是一个已经做了一段时间的人使用的东西 -- jroller.com/rickard/entry/word_to_html_in_java