【问题标题】:VTD-XML Parsing Performance (speed critical factor). Requesting Feedback/CommentsVTD-XML 解析性能(速度关键因素)。请求反馈/评论
【发布时间】:2010-03-26 10:31:21
【问题描述】:

我即将使用 VTD-XML(在 http://vtd-xml.sourceforge.net/ 找到),但我有兴趣获得任何使用过该库并拥有任何 cmets 的人的真实案例使用反馈。

在 URL (http://vtd-xml.sourceforge.net/) 上有基准测试,但如果有人使用过 VTD-XML 并且有 cmets,我想听听他们的意见。速度是应用程序中的一个关键因素,开发人员在实际使用后的 cmets 是我所寻找的。​​p>

问候,

【问题讨论】:

    标签: java xml performance vtd-xml


    【解决方案1】:

    我使用 VTD-XML 来获得更快的 XPath。以前,我的应用程序使用 DOM 在一个文档上应用 XPath,这在一个 17MB 的文档上花费了大约 20 分钟。我考虑过切换到 SAX,但 SAX 不支持 XPaths,非常“用户不友好”并且需要大量代码重组。所以我非常轻松地迁移到 VTD-XML,现在我的 xml 处理大约需要 20 秒!

    【讨论】:

      【解决方案2】:

      VTD-XML 性能已通过多个来源进行测量,以下是其中的一些来源

      1. 此报告 (https://code.ai.techfak.uni-bielefeld.de/trac/xcf/wiki/Evaluation) 包含与 XOM、二进制 XML、SAX 和 DOM 相比衡量解析/xpath 性能的数字

      2. 还有xmlbench(在网络上作为关键词搜索)会带你进入专注于XML解析性能站点的开源项目

      3. VTD-XML 网站也有一些基准报告(很快就会有更新)。

        1. 这是一些葡萄牙研究人员在 2013 年发表的论文。http://sdiwc.net/digital-library/web-admin/upload-pdf/00000466.pdf

      【讨论】:

      • 谢谢。我正在寻找使用过它的开发人员的 cmets。对来自发布库的网站的基准报告要谨慎一些。
      • 你完全有权利保持谨慎......我认为他们发布的不仅仅是基准报告,还有测试代码和 XML 文件,所以你可以自己做并验证结果.. .
      • 这里还有一个来自尝试过的人的链接codeproject.com/Messages/2715769/Excellent-Parser.aspx
      【解决方案3】:

      我发现 VTD-XML 在解析和 XPAth 方面确实更快,但我确实发现它在 XPath 中使用的内存比 DOM 多得多。此外,Java 版本 2.10 不支持属性和 XPath,因此不可行。

      【讨论】:

      • 在使用字符串时确实存在一些内存问题,因此需要切换到 char[] 和 stringBuffer/Builder。
      • 这对我来说甚至都不是什么大问题(我测量的内存来自 vtd-xml 返回给我的内容,所以我无能为力)。属性问题更大,它在 Java 的 2.10 或 2.0 中不起作用,我想知道它是否曾经起作用。
      • 我发现 vtd-xml 比 dom 消耗更多内存的可能性很小。这几乎是不可能的。属性问题是一个已修复的错误。
      • 那是前一段时间(2010 年),我通过在为 XPATH 实例化所需的 VTD xml 类之前和之后对内存进行快照来测试它。欢迎您再次对其进行基准测试。但请注意,这是针对 XPath 的。这远非不可能,而是众所周知的时空权衡效应 (en.wikipedia.org/wiki/Space%E2%80%93time_tradeoff)
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2023-03-18
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多