【发布时间】:2014-04-11 08:48:42
【问题描述】:
我尝试在 Jamendo 站点的主体标签中提取 JSon:
<body id="album-home" data-tracksMgr='{...}'>
我研究过 HTML::Element 和 HTML::Tree::Scanning 但我没有运气。如果我转储树,我会看到 data-tracksMgr。
use strict;
use warnings;
use HTML::TreeBuilder;
use YAML::Any qw'DumpFile LoadFile';
my $url = 'http://www.jamendo.com/de/list/a116765';
my $tree = HTML::TreeBuilder->new_from_url( $url );
my @data = $tree->attr_get_i("data-tracksMgr");
DumpFile('test.yaml', @data);
感谢您的帮助!
【问题讨论】:
-
HTML 是什么样的?您是否收到任何错误或其他输出?
-
您可以查看网站上的 HTML - 我没有收到任何错误...我没有收到任何回复
-
该 URL 返回 301。请尝试访问该 URL。
-
如果你使用 $data 而不是 @data 会发生什么。 $data 将移动它返回的 attr_get_i 数组中的第一个元素。
标签: html perl parsing custom-attributes