【发布时间】:2012-03-04 16:54:35
【问题描述】:
我是 PHP 的初学者,正在开发一个可以从 Youtube 网页中提取标题/描述/标签(或关键字)的脚本。例如,使用任何 youtube 页面,例如 http://www.youtube.com/watch?v=yADOdeZTD9c .. 它的 HTML 代码包含
<meta name="keywords" content="nirvana, unplugged, performing, tocando, cantando, come, as, you, are, Come, As, You, Are, nevermind, live, en, vivo, 1992, 1993, acoustic, acustica, complet...">
我的代码能够从上面的行中提取关键字。相关部分代码如下:
$meta_elements = $pageDOM->getElementsByTagName('meta');
foreach ($meta_elements as $meta_element) {
if (strtolower($meta_element->getAttribute('name')) == 'description')
{
$aValues['description'] = $meta_element->getAttribute('content');
echo $meta_element->getAttribute('content');
}
}
我试图修改它以提取类别信息,但我无法这样做,因为无法以与关键字或描述相同的方式提取类别名称。
我认为网站的 HTML 代码中可以提取类别的部分是这样的:
Category:
</h4>
<p id="eow-category"><a href="/music">Music</a></p>
非常感谢任何关于如何提取“音乐”(大小写无关紧要)的建议..
谢谢你:)
【问题讨论】:
标签: php html youtube web-scraping