使用 Javascript 加载内容时，如何使用 Nokogiri 解析页面？

【问题标题】：How can I parse a page with Nokogiri when content is loaded using Javascript?使用 Javascript 加载内容时，如何使用 Nokogiri 解析页面？
【发布时间】：2013-01-26 03:47:09
【问题描述】：

我正在尝试解析 Twitch.tv website 中的一些内容，作为 Nokogiri 的学习练习。

在获取 HTML 文档时，我没有在 Google Chrome 上看到源代码，似乎内容是通过 Javascript 加载的，而不是在初始 GET 请求中加载的。

如何使用 Nokogiri 解析来自该网站的流列表？或者更笼统地说，如何解析 DOM 完成加载后动态加载的内容？

【问题讨论】：

标签： ruby ruby-on-rails-3 nokogiri

【解决方案1】：

数据是 json，所以你不要使用 nokogiri。例如：

require 'open-uri'
require 'json'
hash = JSON.parse open('http://api.twitch.tv/kraken/games/top?limit=10&on_site=1').read

【讨论】：

那里的“海妖”是什么？当我删除限制参数时，尽管没有更改 HTTP 请求类型，但我收到了 SSL 错误。感谢您的帮助！
我不知道那是什么，我只是注意到页面从那个 url 加载了 json 数据。