【发布时间】:2012-02-04 01:09:54
【问题描述】:
我想使用 perl 从网页中获取所有链接 (<a href='http://.*'),我应该使用哪个模块?还是自己使用正则表达式?
【问题讨论】:
标签: perl html-parsing web-scraping
我想使用 perl 从网页中获取所有链接 (<a href='http://.*'),我应该使用哪个模块?还是自己使用正则表达式?
【问题讨论】:
标签: perl html-parsing web-scraping
您是否使用WWW::Mechanize 获取网页? 如果是,那么您可以使用该模块中的函数$mech->links() 来获取所有链接。
【讨论】:
LWP::UserAgent 的子类,所以它的速度应该基本相同。