【问题标题】:Convert Doc or Docx into HTML in Java在 Java 中将 Doc 或 Docx 转换为 HTML
【发布时间】:2012-01-29 01:20:31
【问题描述】:

如何在 Java 中将 doc 或 docx 转换为 HTML。使用 Apache POI,我能够将 doc 转换为 html,但无法将 docx 转换为 html?请给我看示例代码?此代码适用于 doc,但不适用于 docx。

        HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(stream);

        WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
                DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
        wordToHtmlConverter.processDocument(wordDocument);
        Document htmlDocument = wordToHtmlConverter.getDocument();
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        DOMSource domSource = new DOMSource(htmlDocument);
        StreamResult streamResult = new StreamResult(out);

        TransformerFactory tf = TransformerFactory.newInstance();
        Transformer serializer = tf.newTransformer();
        serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
        serializer.setOutputProperty(OutputKeys.INDENT, "yes");
        serializer.setOutputProperty(OutputKeys.METHOD, "html");
        serializer.transform(domSource, streamResult);
        out.close();

        String result = new String(out.toByteArray());

【问题讨论】:

标签: java spring-mvc apache-poi


【解决方案1】:

没有理由不应该/不能工作。

请查看以下内容:

简而言之,请确保您使用的是最新版本的 POI,并拥有所有必需的库。

(如果您需要额外的帮助,请说明什么不起作用。您是否遇到编译时错误?运行时错误?意外输出?)

【讨论】:

  • 谢谢。您的链接仅显示了如何提取 docx,但我需要将 docx 转换为 html。
  • @user960567 - 您是如何将 *.doc 转换为 HTML 的?使用 *.docx 确实应该没有什么不同。您尝试过什么,您在哪里遇到问题?
猜你喜欢
  • 1970-01-01
  • 2023-04-06
  • 1970-01-01
  • 1970-01-01
  • 2011-06-16
  • 1970-01-01
  • 1970-01-01
  • 2011-10-03
  • 1970-01-01
相关资源
最近更新 更多