【发布时间】:2018-05-31 05:02:32
【问题描述】:
我一直在使用出色的python-docx 包来读取、修改和编写Microsoft Word 文件。该包支持从每个段落中提取文本。它还允许一次访问一个“运行”段落,其中运行是一组具有相同字体信息的字符。不幸的是,当您通过运行访问段落时,您会丢失链接,因为该包不支持链接。该软件包也不支持访问更改跟踪信息。
我的问题是我需要访问更改跟踪信息。或者,更具体地说,我需要将具有更改跟踪指示的段落从一个文档复制到另一个文档。
我已经尝试在 XML 级别执行此操作。例如,这段代码 sn -p 将 file1.docx 的内容附加到 file2.docx:
from docx import Document
doc1 = Document("file1.docx")
doc2 = Document("file2.docx")
doc2.element.body.append(doc1.element.body)
doc2.save("file2-appended.docx")
当我尝试在 Mac 上打开文件以查看复杂文件时,出现以下错误:
但是如果我点击确定,内容就在那里。对于非常简单的文件,该操作也没有问题。
我错过了什么?
【问题讨论】:
标签: ms-word python-docx