【发布时间】:2015-10-13 03:13:30
【问题描述】:
我有一个物品清单:
<div class="item">
<a href="//external-link.com">
<img src="main-image.jpg" alt=""/>
</a>
<h2> Title </h2>
<p> Description lorem here </p>
</div>
<div class="item">
<a href="//external-link.com">
<img src="main-image.jpg" alt=""/>
</a>
<h2> Title </h2>
<p> Description lorem here </p>
</div>
<div class="item">
<a href="//external-link.com">
<img src="main-image.jpg" alt=""/>
</a>
<h2> Title </h2>
<p> Description lorem here </p>
</div>
我想提取<h2>标签的文本,以及<a>和<img>标签的“src”和“href”,但我不知道如何提取“src”和“href”属性。
这有点像我正在使用的东西:
require 'nokogiri'
require 'open-uri'
pageURL = 'http://ticketdriver.com/amg/buy/tickets'
page = Nokogiri::HTML(open(pageURL), nil, 'UTF-8')
page.css('.item').each do |node|
title = node.css('h2').text
srcUrl = node.css('img')['src']
end
text 部分正在工作,但我无法访问“.item”子元素的键和值。我尝试了children[0]、[0]['src']、[:src]、attr()、attribute() 等等。
我完全没有想法和 Google 搜索页面。
【问题讨论】:
-
欢迎来到 Stack Overflow。请避免使用称呼(“嗨,我是 Ruby 和 nokogiri 的新手。”)、告别辞或签名。 Stack Overflow 不是对话,而是写关于如何解决问题的文章。