【问题标题】:How to read .doc and .docx file in .net without interop, openxml or Aspose? [closed]如何在没有互操作、openxml 或 Aspose 的情况下读取 .net 中的 .doc 和 .docx 文件? [关闭]
【发布时间】:2017-03-21 20:56:02
【问题描述】:

我正在尝试阅读 word 文档。 我可以使用 openXml 读取 .docx 文件,但出现错误

文件包含损坏的 .doc 文件数据。

我不想要像 aspose 这样的付费库,如果没有安装 word,它也应该可以工作。

【问题讨论】:

  • 那你就可以自己写解析器了。
  • 感谢您的回复,但您能提供任何示例吗?对我有帮助
  • 为旧的.doc 文件编写自己的解析器是一项相当艰巨的任务,因为格式非常复杂 AFAIK。因此,任何类型的例子对于 Stack Overflow 上的答案来说都太过分了。所以我想除非你找到某种能够编辑旧的.doc 文件的免费库(我不知道),否则你很可能需要查看一些商业可用的库,例如 Aspose,或使用 Interop读取这些文件(或者只是放弃对 .doc 文件的支持并坚持使用 OpenXML 和 .docx 文件)。
  • 你可以使用npoi.codeplex.com可以阅读doc、xlsx等
  • openxml 不支持 .doc...您可以尝试将 .doc 转换为 .docx 然后阅读它...见stackoverflow.com/questions/6489592/…

标签: c# .net openxml


【解决方案1】:

选项 1 是编写自己的库来解决问题。建议不要采用此选项,因为这将成为比您正在处理的项目更大的项目。

选项 2

我不想要像 aspose 这样的付费库,如果没有安装 word,它也应该可以工作。

您可以使用Syncfusion docio。如果您符合条件,则有免费许可证here。我们将它用于与文档相关的解析。我们对图书馆很满意。

【讨论】:

    猜你喜欢
    • 2012-03-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-10-21
    • 2011-08-06
    相关资源
    最近更新 更多