【问题标题】:Action module to convert the word and ppt into xml using CPF使用 CPF 将 word 和 ppt 转换为 xml 的操作模块
【发布时间】:2016-08-29 17:53:39
【问题描述】:

有什么方法可以使用 CPF 的管道功能将 MS-Word 和 powerpoint 数据和元数据转换为 xml..?

提前致谢

【问题讨论】:

标签: marklogic marklogic-8


【解决方案1】:

已经有一些管道可以处理 MS Office 的压缩 XML 格式。将管道“Office OpenXML Extract”和“WordprocessingML Process”附加到您的域。您不会像从二进制 (.doc) MS Word 文档那样完全向上转换为 DocBook,但我们会稍微整理一下 XML,您可以在末尾添加自己的转换。

【讨论】:

    【解决方案2】:

    简短的回答是可以转换为 XML。

    更长的答案是,这取决于什么版本。任何通过 word 2007 的版本都已经是 XML 格式。它只是压缩并在其中包含多个 XML 文档。 PowerPoint 也是如此。该 XML 的格式可能很棘手,您很可能希望将其转换为更简洁的版本。

    最新版本的 word 也有一个新的模式,所以 XML 的格式会有所不同。

    您可以先看看xdmp:word-convert 会给您带来什么。如果这还不够好,您可以使用xdmp:zip-get 编写自己的代码。由于 word 文件本身是一个 zip 文件,因此您可以调用它并了解 docx 的组合方式并决定如何隐藏它。

    要使此功能与 CPF 一起使用,您必须编写自己的操作模块并配置 CPF 管道以使其具有步骤。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2015-06-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-10-05
      相关资源
      最近更新 更多