【发布时间】:2011-02-01 03:48:05
【问题描述】:
我正在尝试使用WWW::Mechanize 使用find_all_links() 方法从HTML 页面中提取一些链接。它支持匹配这些条件:
- 文字
- text_regex
- 网址
- url_regex
- url_abs
- url_abs_regex
...
如何提取所有链接除了包含文本“xyz”的链接?
【问题讨论】:
标签: perl www-mechanize
我正在尝试使用WWW::Mechanize 使用find_all_links() 方法从HTML 页面中提取一些链接。它支持匹配这些条件:
如何提取所有链接除了包含文本“xyz”的链接?
【问题讨论】:
标签: perl www-mechanize
您可以使用'text_regex' 条件:
$mech->find_all_links(text_regex => qr/^(?!xyz$).*$/);
请参阅perldoc perlre 了解更多关于负前瞻断言的信息。
【讨论】:
为什么不获取所有链接,然后使用“grep”跳过不需要的链接?
【讨论】: