【问题标题】:Getting the siblings of a node with Nokogiri使用 Nokogiri 获取节点的兄弟姐妹
【发布时间】:2013-05-30 04:53:15
【问题描述】:

有没有办法在一个节点中找到一个特定的值,然后返回它的所有兄弟值?

例如,我想找到包含 ID 5678 的 id 节点,然后获取与 ID 5678 关联的电子邮件地址和所有图像。

Nokogiri::XML.parse(File.open('info.xml'))

这是一个示例 XML 文件。

<xmlcontainer>
  <details>
    <id>1234</id>
    <email>sdfsdf@sdasd.com</email>
    <image>images/1.jpg</image>
    <image>images/2.jpg</image>
    <image>images/3.jpg</image>
  </details>
  <details>
    <id>5678</id>   
    <email>zzzz@zzz.com</email>
    <image>images/4.jpg</image>
    <image>images/5.jpg</image>
  </details>
  <details>
    <id>9011</id>   
    <email>aaaa@aaa.com</email>
    <image>images/6.jpg</image>
    <image>images/7.jpg</image>
  </details>
</xmlcontainer>

【问题讨论】:

    标签: ruby nokogiri


    【解决方案1】:

    你可以使用~,这是css通用兄弟选择器:

    doc.search('id[text()="5678"] ~ *').map &:text
    #=> ["zzzz@zzz.com", "images/4.jpg", "images/5.jpg"]
    

    将 css 与 xml 一起使用有点奇怪,但它更容易查看(比 xpath)。

    【讨论】:

    • 非常好的语法'id[text()="5678"] ~ *'。我第一次发现基本上XPATH 就像[text()="5678"] 一样。你在哪里见过这样的伎俩? :) 如果可能,请解释搜索表达式。
    • [text()="5678"] 不是标准 css,但 nokogiri 允许。剩下的只是CSS。 ~ * 表示任何兄弟元素
    • +1 "将 css 与 xml 一起使用有点奇怪,但它更容易查看(比 xpath)。"我同意,我很高兴 Nokogiri 给了我们这个选择。 CSS 通常更具可读性。
    • "[text()="5678"] 不是标准 css,但 nokogiri 允许。"我还没有检查过,但我怀疑它是从 Nokogiri 的 jQuery 的 CSS 访问器实现中引入的 CSS 的扩展。
    • 其实 jQuery 有一个叫做 contains 的函数,但是没有办法轻松匹配精确的文本。
    【解决方案2】:
    require 'nokogiri'
    doc = Nokogiri::XML.parse(File.open('info.xml'))
    details = doc.css('details').find{|node| node.css('id').text == "5678"}
    email = details.css('email').text # => "zzzz@zzz.com"
    images = details.css('image').map(&:text) # => ["images/4.jpg", "images/5.jpg"]
    

    更新:有更短,可以说是更好的方法来获取您想要的 details 节点:

    details = doc.at('details:has(id[text()="5678"])')
    

    details = doc.search('id[text()="5678"] ~ *')
    

    这些都是 pguardiario 提供的。

    【讨论】:

    • 您可以通过将select{}.first 替换为find{} 来加强这一点,或者您可以使用doc.at('details:has(id[text()="5678"])') 更直接地访问详细信息节点
    • @pguardiario 搜索文档的方法有很多!感谢您的提示!
    • 不客气!同样在这种情况下,xpath 实际上可能更简单:doc.at('//id[text()="5678"]/..')
    • 确实有用。 ".." 被 w3.org/TR/xpath/#path-abbrev facepalm 覆盖
    猜你喜欢
    • 2012-02-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-09-20
    • 2019-05-06
    • 1970-01-01
    相关资源
    最近更新 更多