【发布时间】:2016-07-24 14:45:16
【问题描述】:
如何使用 DOMDocument 从 ID 为 categories 的 p 标签内的 <p> 标签中获取内容?
代码如下:
<?php
ini_set('max_execution_time', 300);
//error_reporting(0);
$errmsg_arr = array();
$errflag = false;
function getState($string)
{
$ex = explode(" ",$string." ");
return $ex[1];
}
$xml = "";
$xml .= '<?xml version="1.0" encoding="UTF-8" ?>';
$xml .= '
<tv generator-info-name="www.mysite.com/xmltv">';
$baseUrl = file_get_contents('www.myscript.com/get-listing.php');
$domdoc = new DOMDocument();
$domdoc->strictErrorChecking = false;
$domdoc->recover=true;
$domdoc->loadHTML($baseUrl);
?>
例如,我的 HTML 可能如下所示:
<p id='categories'>Sports</p>
我正在尝试提取以下文本:
Sports
所以当我尝试这个时:
$p = $domdoc->getElementById('categories')->getElementsByTagName('p')->item(0);
回声 $p;
它不会从 id categories 中提取内容。
我该怎么做?
【问题讨论】:
-
附带说明,
p标签 read 内不能有p标签。在源视图中,firefox 以红色突出显示类似<p id="categories"> <p>Sports</p> </p>的问题 -
我更新了我的答案...
标签: php html xpath domdocument