【发布时间】:2014-11-16 16:48:48
【问题描述】:
我有一个应用程序,它根据大量参数输出一个大的 Word XML Formatted xml 文件(沿 200000 行)。
我想编写单元测试来根据参数组合检查输出文件的内容。
我需要一种方法来检查输出文件中是否存在大型 xml sn-p,而不会出现与格式相关的问题(标签外的空格、制表符、新行等):
//that would be perfect
assertXMLContains("Checking if outputted xml contains the needed xml snipped",
outputtedXml, mySnipXML);
优秀的 XMLUnit (http://xmlunit.sourceforge.net/) 提供了一种仅断言 xml 内容相等的方法,所以我似乎无法使用它。
下面是我们需要搜索的那种 xml sn-ps 的示例。它们可以是 w:p 或 w:r 元素的串联,不一定要在父元素内分组...
<w:r w:rsidR="00EE0BED" w:rsidRPr="009322FC">
<w:rPr>
<w:rFonts w:ascii="Times New Roman Bold" w:eastAsia="Times New Roman" w:hAnsi="Times New Roman Bold"/>
<w:b/>
<w:caps/>
<w:sz w:val="24"/>
<w:szCs w:val="24"/>
<w:lang w:eastAsia="en-GB"/>
</w:rPr>
<w:t>Annex V</w:t>
</w:r>
<w:r w:rsidR="00B40C3C" w:rsidRPr="009322FC">
<w:rPr>
<w:rFonts w:ascii="Times New Roman Bold" w:eastAsia="Times New Roman" w:hAnsi="Times New Roman Bold"/>
<w:b/>
<w:caps/>
<w:sz w:val="24"/>
<w:szCs w:val="24"/>
<w:lang w:eastAsia="en-GB"/>
</w:rPr>
<w:t>II</w:t>
</w:r>
【问题讨论】:
-
你不能只使用 XPath 来查找所需的元素吗?
-
我不这么认为。上面的例子只是一个小sn-p。通常,我们会按特定顺序搜索几十个
元素,除了 元素的内容(即 Annex V )
标签: java xml unit-testing ms-word