【问题标题】:How to convert a word document to a text file in c# without using microsoft.office.interop?如何在不使用 microsoft.office.interop 的情况下将 word 文档转换为 c# 中的文本文件?
【发布时间】:2013-06-07 10:27:14
【问题描述】:

我有很多不同版本的 word 文档需要转换成文本文件。
我希望这个链接能给你带来正确的方式 How to extract text from Word files using C#? 我想阅读 word 文档的内容并删除所有格式(文本文件中只有单词)。我已经通过使用不推荐的 microsoft.office.interop(这里,总是在客户端上实例化一个 Word)来完成。所以我正在尝试创建一个应该自动将单词转换为文本的 c# 项目。任何人都可以向我推荐任何第 3 方工具,它应该是高效的开源工具或价格合理的 c# 中所有版本的 word 到文本文件转换的工具?

问候, 山提尼

【问题讨论】:

  • 我也想看到答案。
  • word 只是皮下的 xml 文件。将 .doc 更改为 .zip 并将其解压缩并查看,但您在这里陷入了一个非常深的兔子洞。
  • 您要复制多少个word文件?如果大量,那么是的,第三方可能会更好,但如果不是,您可能需要查看 filewriter 和 streamwriter,在其中复制 word 文档,创建一个新的 .txt 文件并将字符串粘贴到 txt 文件中。
  • @deltree - 你确定这适用于doc(而不是docx)?
  • @Corak 我知道它适用于 docx。我还没有在文档上尝试过。

标签: c# file-conversion


【解决方案1】:

最后我找到了目前对我来说完美的解决方案。我还没有测试过 10000 个文档。给你。,http://sourceforge.net/projects/word-reader/?source=dlp 期待有关此解决方案的评论和建议...

谢谢你, 山提尼

【讨论】:

  • 很遗憾,没有附上源代码,即使它托管在sourceforge上。
  • 如果您想对大量文件类型(不仅仅是 MSWord)执行此操作,请参阅stackoverflow.com/a/41091943/495455
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2018-04-25
  • 2023-03-04
  • 2023-03-11
  • 1970-01-01
  • 2020-12-20
  • 1970-01-01
  • 2019-04-17
相关资源
最近更新 更多