【发布时间】:2012-07-05 22:19:45
【问题描述】:
我想在 Haskell 中进行一些屏幕抓取(来自 Netflix),但该站点需要 cookie 登录状态,因此大多数示例使用浏览器自动化来要求登录的浏览器执行实际的 URL 获取,然后从该文本中抓取。
我想要(在 Ruby 中)的一个很好的例子是:https://gist.github.com/1425290
是否有任何简单的方法可以从 Haskell 中进行等效操作?
【问题讨论】:
-
有什么特别的原因不能让您只音译 Ruby 代码吗? (
System.Process模块可能会有所帮助。) -
是的; Ruby 代码使用 JavaScript 驱动浏览器获取页面,这是我在 Windows 上询问的另一种方法,因为它不支持 JS。
-
JavaScript 绝对可以在 Windows 上运行……您现在正在使用它。该脚本实际上使用 Applescript,它是特定于 OSX 的。
-
啊,是的,感谢您的更正,我在讨论 Mac 时通常会混淆术语! :-)
-
这可能是一个与语言无关的问题(“什么是在窗口上抓取屏幕的好方法?”或其他什么),然后在 Haskell 中研究如何做到这一点。
标签: haskell screen-scraping web-scraping