XPath 表达式对 //element 不返回任何内容，但 //* 返回一个计数答案

【问题标题】：XPath Expression returns nothing for //element, but //* returns a countXPath 表达式对 //element 不返回任何内容，但 //* 返回一个计数
【发布时间】：2025-12-01 00:05:02
【问题描述】：

我将 XOM 与以下示例数据一起使用：

Element root = cleanDoc.getRootElement();
//find all the bold elements, as those mark institution and clinic.
Nodes nodes = root.query("//*");

<html xmlns="http://www.w3.org/1999/xhtml" xmlns:html="http://www.w3.org/1999/xhtml">
    <head>
        <title>Patient Information</title>
    </head>
</html>

以下元素返回许多元素（来自真实数据）：

//*

但是像

//head

什么都不返回。如果我遍历根的孩子，数字似乎匹配，如果我打印元素名称，一切似乎都正确。

我正在获取 HTML，用 tagoup 解析它，然后从生成的字符串构建一个 XOM 文档。这其中的哪一部分会出现如此可怕的错误？我觉得这里发生了一些奇怪的编码问题，但我只是没有看到它。 Java 字符串就是字符串，对吧？

【问题讨论】：

标签： java xpath xml-namespaces xom tag-soup

【解决方案1】：

您的文档有一个默认命名空间，这意味着在 XPath 模型中所有元素都在该命名空间中。

查询应该是//html:head。您必须为 XPath 查询提供命名空间映射。

请注意，虽然 XPath 表达式使用命名空间前缀，但必须匹配的是命名空间 uri。

XPathContext ctx = new XPathContext("html", "http://www.w3.org/1999/xhtml");
Nodes nodes = root.query("//html:head", ctx );

【讨论】：

啊，我明白了。我过去使用的所有文档都是完全无命名空间的，所以我以前没有遇到过这个问题。谢谢。