【发布时间】:2008-10-08 11:52:52
【问题描述】:
我在一家公司工作,出于某种原因,该公司坚持我们所有的开发文档都应该是 MS Word 格式。作为二进制格式,这意味着我们不能:
- 不同版本的文档相互对照(因此同行评审很痛苦 - 由于我们工作的领域,所有更改的同行评审都是必不可少的)
- Grep 一个文件夹,里面装满了关键字的文档
你用什么来写文档,为什么?
还请给我弹药来改变这种情况……
【问题讨论】:
-
MS word docx 格式不是二进制格式,如果您让它们转向新的 word 格式,您可以更轻松地对它们进行 diff 和 grep。
-
如果你的弹药不够用,word-doc-diff 可能对第 1 点有所帮助:softinterface.com/WDD/WDD.htm
-
@PintSizedCat docx 文件本质上是包含 XML 内容的 zip 文件,因此它们是二进制文件。即使您提取 XML,它们也是机器生成的密集 XML 文件,没有换行符。总而言之,对于 diff/grep 来说并非易事。
标签: documentation