【问题标题】:create help file in txt from a ms word document从 ms word 文档在 txt 中创建帮助文件
【发布时间】:2014-07-15 09:07:45
【问题描述】:

我需要从 ms word 文档创建一个 txt 文件。 txt 文件将用作我的用户界面的帮助文档,因此它需要采用特殊格式。是否有任何第三方软件可用于读取 ms word 文档并从中以某种格式创建文本文件?或者,我是否可以使用 PERL 以一种可以提取 word doc 中指定的标题、表格和节标题的方式读取 word doc。我需要阅读 word 文档,并且在解析它时,我需要找出一种方法来说明从 ms word doc 解析的行是表格内容还是部分标题?或者还有其他方法吗?

【问题讨论】:

  • 那是什么特殊格式?描述你到底想要做什么,而不是仅仅想要一个“文本文件”!

标签: vba perl parsing ms-word win32ole


【解决方案1】:

我对解析 HTML 比较熟悉,所以我建议您先使用 MSWord::ToHTML 或一些等效模块将您的 Word 文档翻译成 HTML。

然后,您可以使用无数 HTML 解析模块之一,例如 Mojo::DOM 来解析您的数据及其样式。有一个 8 分钟的视频,介绍如何使用后一个模块 Mojocast Episode 5

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-01-21
    • 2012-01-29
    • 1970-01-01
    • 1970-01-01
    • 2011-05-16
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多