【问题标题】:Scraping data using Nokogiri使用 Nokogiri 抓取数据
【发布时间】:2016-05-28 07:02:01
【问题描述】:

我正在尝试使用 Nokogiri 抓取数据。我试图访问的代码是:

<div class="main-header">
    <span>Make More Money</span>
</div>

我只想获得“赚更多钱”的文字。这是我的代码:

url = 'xyz.com'
doc = Nokogiri::HTML(open(url)) 
doc.at_css('main-header span').text

使用这个我得到一个NilClass 错误。我需要做什么来解决这个问题?

【问题讨论】:

  • 您的 CSS 选择器有问题。我怀疑第一个元素是由div#main-header 选择的,而不仅仅是main-header

标签: ruby-on-rails ruby web-scraping nokogiri


【解决方案1】:

main-header 类的 . 丢失。应该是

doc.at_css('.main-header span').text

【讨论】:

  • 感谢您的回答。在HTML元素中的类是JavaScript动态添加的时候可以用吗
  • 不,Nokogiri 不执行 javascript。可以找到一些替代方案,例如在这个问题中:stackoverflow.com/questions/11494994/…
  • 我推荐 Capybara 和 Poltergeist!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2017-08-25
  • 1970-01-01
  • 1970-01-01
  • 2012-01-14
  • 1970-01-01
  • 2013-09-30
  • 2023-03-14
相关资源
最近更新 更多