【发布时间】:2011-02-08 22:44:41
【问题描述】:
我正在尝试从 Perl 中提取信息的网站,但是我需要的页面部分是使用 javascript 生成的,因此您在源代码中看到的只是:
<div id="results"></div>
我需要以某种方式提取该 div 的内容并将其保存到使用 Perl/proxies/whatever 的文件中。例如我要保存的信息是
document.getElementById('results').innerHTML;
我不确定这是否可能,或者是否有人有任何想法或方法来做到这一点。 我对其他页面使用了 lynx 源转储,但由于我无法直接从屏幕上抓取此页面,所以我来这里询问一下!
如果有人感兴趣,页面是http://downloadcenter.trendmicro.com/index.php?clk=left_nav&clkval=pattern_file®s=NABU,我想获取的信息是关于 ConsumerOPR 的行
【问题讨论】:
-
我也对此感兴趣...您能看到和/或您是否有权访问 AJAX 请求 URL(假设数据是通过 AJAX 填充的)?
-
是的,我可以看到 ajax,但是在这个站点上,所有从 ajax 查询返回的都是另一个 js 函数,results.innerHTML 被设置为。
标签: javascript html perl screen-scraping