【问题标题】:How can I parse a page with Nokogiri when content is loaded using Javascript?使用 Javascript 加载内容时,如何使用 Nokogiri 解析页面?
【发布时间】:2013-01-26 03:47:09
【问题描述】:

我正在尝试解析 Twitch.tv website 中的一些内容,作为 Nokogiri 的学习练习。

在获取 HTML 文档时,我没有在 Google Chrome 上看到源代码,似乎内容是通过 Javascript 加载的,而不是在初始 GET 请求中加载的。

如何使用 Nokogiri 解析来自该网站的流列表?或者更笼统地说,如何解析 DOM 完成加载后动态加载的内容?

【问题讨论】:

    标签: ruby ruby-on-rails-3 nokogiri


    【解决方案1】:

    数据是 json,所以你不要使用 nokogiri。例如:

    require 'open-uri'
    require 'json'
    hash = JSON.parse open('http://api.twitch.tv/kraken/games/top?limit=10&on_site=1').read
    

    【讨论】:

    • 那里的“海妖”是什么?当我删除限制参数时,尽管没有更改 HTTP 请求类型,但我收到了 SSL 错误。感谢您的帮助!
    • 我不知道那是什么,我只是注意到页面从那个 url 加载了 json 数据。
    猜你喜欢
    • 2011-12-09
    • 1970-01-01
    • 2013-01-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-05-06
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多