【问题标题】:Converting DOCX to HTML without MS Office在没有 MS Office 的情况下将 DOCX 转换为 HTML
【发布时间】:2011-11-20 22:27:35
【问题描述】:

是否有 .NET 组件可以将 docx 转换为 HTML(例如按照 Word->SaveAs->HTMLPage)但没有安装 MS Office?

【问题讨论】:

  • 它必须是一个 .NET 组件吗? OpenOffice 可以做到这一点,在 Windows 上运行并具有无头模式(即可从命令行使用)
  • Mammoth.js https://github.com/mwilliamson/mammoth.js 可以作为基本转换的不错选择

标签: .net html docx


【解决方案1】:

你应该看看Aspose.Words

他们的库允许在各种文档格式之间进行转换,包括通过代码将 DOC/DOCX 转换为 HTML。他们有一个非常直观和简单的 API,并且非常积极地开发和改进他们的库。

【讨论】:

  • 你知道类似的工具吗?我需要相反的方式,HTML To Docx / PDF。但是,对于我从老板那里得到的预算来说,这句话太贵了
  • 我不熟悉特定的 HTML 到 PDF 库,但我确信有一些。如果您想省钱(以编写自己的代码为代价),可以自己创建 HTML 到 DOCX - 您只需学习 DOCX 语言......
【解决方案2】:

您可能想使用 Mammoth docx 到 HTML 库,它的 7 年为时已晚,似乎 :) 但无论如何它是一个用于显示 doc、docx 文档的库,通过在浏览器端将它们转换为 html 以及可以在后端处理。

【讨论】:

    猜你喜欢
    • 2012-11-21
    • 2012-09-30
    • 1970-01-01
    • 2019-10-30
    • 1970-01-01
    • 2017-05-27
    • 2018-08-15
    • 2021-10-24
    • 1970-01-01
    相关资源
    最近更新 更多