【问题标题】:Perl HTML parserPerl HTML 解析器
【发布时间】:2011-10-31 05:49:46
【问题描述】:

我在解析 HTML 文件时遇到了一些困难。

这是我要提取网站名称的HTML文件部分:

<span class="bold1">Name: </span>www.google.com<br />

<span class="bold1">Name: </span>www.facebook.com<br />

<span class="bold1">Name: </span>www.myspace.com<br />

这是使用HTML::TreeBuilder模块的Perl代码sn-p

my @style = $root->look_down('class' => qr/bold1$/);

我们如何在这里提取下一个元素:我想从上面的示例中提取:

  1. www.google.com
  2. www.facebook.com
  3. www.myspace.com
for (@style) 
{
   my $title1 = $_->as_HTML; #text
   print " title" . $title .  "\n";
}

谢谢

【问题讨论】:

标签: perl web-scraping


【解决方案1】:

使用right() 方法。

【讨论】:

  • 非常感谢,我是网站抓取的新手。非常感谢。
  • 在相关说明中,更新了问题。谢谢
猜你喜欢
  • 2012-10-25
  • 1970-01-01
  • 2011-06-03
  • 2011-10-10
  • 2012-10-26
  • 2012-07-03
  • 2012-12-12
  • 1970-01-01
相关资源
最近更新 更多