【发布时间】:2012-02-21 16:17:10
【问题描述】:
由于本网站的帮助,我在 Perl 方面取得了一些不错的进展,但我遇到了问题。我正在抓取的页面之一已更改,我现在不知道如何访问它。我想要做的是存储一个链接到我想要访问的每个页面。问题是这些链接位于源代码中的 a href 属性标签内,我不知道如何提取它们。谁能帮帮我?
我需要的链接是本页第316到354行(源代码)http://www.soccerbase.com/teams/home.sd
我基本上需要提取变量的链接以在我的其他脚本中使用。如前所述,我正在使用 WWW::Mechanize 和 HTML::TokeParser,希望其中有一些我可以使用但目前无法弄清楚的方法。提前致谢!
【问题讨论】:
标签: perl web-scraping perl-module www-mechanize