【发布时间】:2011-10-31 05:49:46
【问题描述】:
我在解析 HTML 文件时遇到了一些困难。
这是我要提取网站名称的HTML文件部分:
<span class="bold1">Name: </span>www.google.com<br />
<span class="bold1">Name: </span>www.facebook.com<br />
<span class="bold1">Name: </span>www.myspace.com<br />
这是使用HTML::TreeBuilder模块的Perl代码sn-p
my @style = $root->look_down('class' => qr/bold1$/);
我们如何在这里提取下一个元素:我想从上面的示例中提取:
- www.google.com
- www.facebook.com
- www.myspace.com
for (@style) { my $title1 = $_->as_HTML; #text print " title" . $title . "\n"; }
谢谢
【问题讨论】:
-
请每个主题只回答一个问题,因此请ask a new question 跟进。您可以从this question's revision history获取文本。
标签: perl web-scraping