【发布时间】:2017-03-21 20:56:02
【问题描述】:
我正在尝试阅读 word 文档。 我可以使用 openXml 读取 .docx 文件,但出现错误
文件包含损坏的 .doc 文件数据。
我不想要像 aspose 这样的付费库,如果没有安装 word,它也应该可以工作。
【问题讨论】:
-
那你就可以自己写解析器了。
-
感谢您的回复,但您能提供任何示例吗?对我有帮助
-
为旧的
.doc文件编写自己的解析器是一项相当艰巨的任务,因为格式非常复杂 AFAIK。因此,任何类型的例子对于 Stack Overflow 上的答案来说都太过分了。所以我想除非你找到某种能够编辑旧的.doc文件的免费库(我不知道),否则你很可能需要查看一些商业可用的库,例如 Aspose,或使用 Interop读取这些文件(或者只是放弃对.doc文件的支持并坚持使用 OpenXML 和.docx文件)。 -
你可以使用npoi.codeplex.com可以阅读doc、xlsx等
-
openxml 不支持 .doc...您可以尝试将 .doc 转换为 .docx 然后阅读它...见stackoverflow.com/questions/6489592/…