【发布时间】:2011-09-14 12:14:58
【问题描述】:
注意:如果您也遇到此问题,请在 Apache JIRA 上投票:
我得出了一个惊人的结论:
Element e = (Element) document.getElementsByTagName("SomeElementName").item(0);
String result = ((Element) e).getTextContent();
似乎比这快了令人难以置信的 100 倍:
// Accounts for 30%, can be cached
XPathFactory factory = XPathFactory.newInstance();
// Negligible
XPath xpath = factory.newXPath();
// Negligible
XPathExpression expression = xpath.compile("//SomeElementName");
// Accounts for 70%
String result = (String) expression.evaluate(document, XPathConstants.STRING);
我正在使用 JVM 的默认 JAXP 实现:
org.apache.xpath.jaxp.XPathFactoryImpl
org.apache.xpath.jaxp.XPathImpl
我真的很困惑,因为很容易看出 JAXP 如何优化上述 XPath 查询以实际执行一个简单的getElementsByTagName()。但它似乎没有这样做。此问题仅限于大约 5-6 个经常使用的 XPath 调用,这些调用由 API 抽象和隐藏。这些查询仅针对始终可用的 DOM 文档涉及简单路径(例如/a/b/c,无变量、条件)。所以,如果能做一个优化,那就很容易实现了。
我的问题:XPath 的缓慢是公认的事实,还是我忽略了什么?有更好(更快)的实现吗?或者我应该完全避免 XPath,对于简单的查询?
【问题讨论】:
-
您是否尝试过将您的结果与compiled、可重复使用的XPathExpression 的结果进行比较?
-
速度慢有问题吗?一种可能性是评估另一个库,例如
jaxen。 -
@McDowell,不。我试试,谢谢
-
@Johan:是的。通常,这些查询往往需要 2-5 毫秒,即用户请求时间的 10%。我们认为这开始有问题,因为我们将在未来使用更多的 XPath。
jaxen将来可能确实是一种选择...... -
@McDowell:缓存表达式可以忽略不计,尤其是与工厂缓存相比。但是经过一些重新测试后,我必须更正时间。缓存工厂将加速大约 30%
标签: java performance apache xpath jaxp