【发布时间】:2014-12-03 16:29:38
【问题描述】:
我试图从 http://www.vrbo.com/354035#calendar 中抓取一些信息,但使用 Nokogiri 和 CSS 选择器我无法获取我想要的值。
在页面源代码中,我看到 <div class="calmonth"> 在 HTML 中位于 <h2>Calendar</h2> 之后。但是当我使用 Nokogiri 并尝试时:
page = Nokogiri::HTML(open("http://www.vrbo.com/354035#calendar"))
calendar = page.css("div.calmonth")
calendar 不应该是空的。
我希望有人可以帮助我。
【问题讨论】:
-
@ArupRakshit 我编辑了问题,请立即查看。
-
在返回的 HTML 中没有
<div class="calmonth">,实际上在带有calmonth类的 HTML 中没有任何内容。也许它是由一些 JavaScript 添加的。 -
@ArupRakshit 已发送邮件
-
@muistooshort 谢谢!
-
尝试查看原始 HTML 而不是您在浏览器中看到的 HTML,如果幸运的话,您会找到您想要的并能够找出正确的选择器。
标签: css ruby scripting web-scraping nokogiri