【发布时间】:2025-12-26 20:10:16
【问题描述】:
我创建了以下 perl 脚本来从网络中提取 URL:
#!perl
use strict;
use warnings;
use List::MoreUtils qw( uniq );
use WWW::Mechanize qw( );
my ($url) = @ARGV;
my $mech = WWW::Mechanize->new();
sub getUrl {
my $request= "@_";
my $response = $mech->get($request);
return $response->is_success() or die($response->status_line() . "\n");
}
sub getLinks {
getUrl($url);
my @root= map { "$_\n" } sort { $a cmp $b } uniq
map { $_->url_abs() }
$mech->links();
return @root;
}
print Dumper(getLinks());
是否有解决方案如何从 HTML 站点中提取唯一 URL 和相关链接文本?
【问题讨论】:
-
为什么要通过附加换行符来隐藏
die语句的行号? -
仅为调试创建的行号选项。
-
...您已经完成调试...?
-
你不需要使用
&来调用Perl的sub:getUrl($url)等 -
@gangabas - 感谢您的提示!