【问题标题】:VTD-XML Exception: Name space qualification Exception: prefixed attribute not qualifiedVTD-XML 异常:命名空间限定异常:前缀属性未限定
【发布时间】:2012-05-17 22:58:49
【问题描述】:

我通过 Web 服务接收 XML,并且正在使用旧代码(使用 dom4j)来执行一些 xml 转换。将原始 XML 加载/解析为 VTD-XML (VTDGen) 工作正常,没有抛出异常。但是,在将 xml 加载到 dom4j 后,我注意到一些元素名称空间声明和属性被重新排列。显然,这种重新安排会导致 VTD-XML 抛出以下异常:

例外: 命名空间限定异常:前缀属性不限定

行号:101 偏移量:1827

这是原始 XML 中此行号处的元素:

这是加载到 dom4j 后的相同元素:

问题在于新 XML 元素中的属性(偏移 1827 处,元素末尾):RR_PerformanceSite:FormVersion="1.4"

以下是消除异常的原因: 1. 将此元素的 RR_PerformanceSite xmlns 声明添加到 XML 文档的根元素。 2.用原来的元素替换新元素。这似乎让我相信属性/ns 声明的顺序会在解析时影响 VTD。

注意:我使用两个 xml 文档(原始和后 dom4j xml)将 ns 感知的 xml 文档设置解析为“真”。此外,还会为每个 xml、original 和 post-dom4j 创建新的 VTD 对象。

我尝试像原始元素一样将 'RR_PerformanceSite:FormVersion="1.4"' 放在元素的开头,但这并没有消除异常。由于属性位置的变化,错误消息中的偏移量不同。 xmlns声明的顺序会影响VTD吗?

我查看了 VTDGen 源代码,但无法弄清楚为什么会引发此异常。

为什么 dom4j 会解析新文档而 vtd 却无法解析?任何人都可以对此有所了解吗?

【问题讨论】:

  • 这个问题可能已经在 2.11 中修复了

标签: vtd-xml


【解决方案1】:

这似乎是 VTD-XML 上的一个错误,与命名空间声明顺序有关。

使用以下 Java 代码始终可重现

public class SchemaTester {

    /**
     * @param args
     */
    public static void main(String[] args) throws Exception {

        String bad = "C:/Temp/VTD_bad.xml"; // XML files to test
        String good = "C:/Temp/VTD_good.xml";

        StringBuilder sb = new StringBuilder();

        char[] buf = new char[4*1024];
        FileReader fr = new FileReader(bad);
        int readed = 0;

        while ((readed = fr.read(buf, 0, buf.length)) != -1) {
            sb.append(buf, 0, readed);
        }

        fr.close();

        String x = sb.toString();

        //instantiate VTDGen
        //and call parse 
        VTDGen vg = new VTDGen();
        vg.setDoc(x.getBytes("UTF-8"));
        vg.parse(true);  // set namespace awareness to true
        VTDNav vn = vg.getNav();



        AutoPilot ap = new AutoPilot (vn);
        ap.selectXPath("//*/@*");

        int i= -1;
        while((i=ap.evalXPath()) != -1) {
            // i will be attr name, i+1 will be attribute value
            System.out.println("\t\tAttribute ==> " + vn.toNormalizedString(i));
            System.out.println("\t\tValue ==> " + vn.toNormalizedString(i+1));
        } 

    }
}

OP 已将 XML 上传到 https://gist.github.com/2696220

【讨论】:

  • 元素 sn-ps 是开始元素,我不想粘贴整个 XML。 XML 文档格式正确。我将尝试在 w3schools 进行验证,但是,使用 dom4j 没问题……是 VTD 与 post-dom4j xml 有问题。
  • 能否请您发布一些您如何解析文档的 Java 代码?
  • 这是将字节加载到 VTD 中的代码的 sn-p: VTDGen vGen = new VTDGen(); vGen.setDoc(submissionXmlBytes); vGen.parse(真); vNav = vGen.getNav();
  • 尝试使用正确编码的 getBytes(...)。另外你使用的JDK版本是什么?
  • 哼...如何在 jdk 1.5 上运行 VTD-XML?最新版本的 VTD-XML(2.9 和 2.10)仅支持 Java >= 6。您使用的是哪个版本的 VTD-XML?