【发布时间】:2012-10-15 16:16:17
【问题描述】:
我一直在研究让 javascript 在网页上执行的方法,但不完全理解某些解决方案。
我将以 TechCrunch 为例。如果您查看 TechCrunch 上的一篇文章,您会在每个页面的顶部看到,它们有一个视觉效果来显示该页面已经完成了多少推文、点赞、cmets。如果我想抓取此页面并收集该信息,perl 中是否有解决方案?
我查看了 WWW::Scripter 和 WWW::Mechanize::Plugin::JavaScript。可能是因为我不完全了解他们提供了什么。但是有没有办法让我传入一个 URL 并让它在页面上运行 javascript,就像浏览器一样,而无需传递变量或其他任何特殊的东西来让它执行。
【问题讨论】:
-
请注意,如果您确实找到了一种抓取 techcrunch 页面的方法并且他们发现您这样做了,他们会尽其所能(在技术上如果不合法)让您破产。
-
感谢其他链接。如果需要,我会看看这些并关闭这个问题。出于某种原因,他们没有出现在我的搜索中:(。@Paul 我完全理解抓取页面的合法性。我以 TechCrunch 为例。您的回答并不真正适用于所询问的内容。
标签: javascript perl web-scraping