【问题标题】:XPath in PHP Removes HTML TagsPHP 中的 XPath 删除 HTML 标签
【发布时间】:2013-12-25 06:14:39
【问题描述】:

我在 PHP 中使用 XPath 来检索 HTML 文档的一部分。假设我的 HTML 文档如下所示:

<html>
    <head>
    </head>
    <body>
        <div id="first">
            <a href="some_link_address.com">Hello</a>
            <p>Some text here</p>
        </div>
        <div id="second">
            <p>Some other text here</p>
            <img src="src/to/image.jpg" />
        </div>
    </body>
</html>

我的 PHP 包括 XPath 调用是:

$result_dom = new DOMDocument('1.0', 'utf-8');
$node_to_keep = $xpath->query("//div[@id='first']");

foreach ($nodes_to_keep as $node) {

    $element = $result_dom->createElement('div', $node->nodeValue;);
    $result_dom ->appendChild($element);
}

我期待生成的 dom 将包含以下内容

<div>
    <a href="some_link_address.com">Hello</a>
    <p>Some text here</p>
</div>

然而这是生成的 dom

<div>
    Hello
    Some text here
</div>

所以我的问题是,如何设置生成的 dom 以包含 html 标签。我不想删除它们

谢谢。

【问题讨论】:

    标签: php html dom xpath


    【解决方案1】:

    元素的“nodeValue”是该元素的文本内容。文档中的文本节点不包括 等,仅包括这​​些元素内部和元素之间的文本。所以,这就是你在新元素中获得的全部内容。

    不要手动创建节点,而是导入结果节点的深层副本并附加:

    $importedNode = $result_dom->importNode($node, true);
    $result_dom->appendChild($importedNode);
    

    【讨论】:

      猜你喜欢
      • 2013-08-19
      • 1970-01-01
      • 1970-01-01
      • 2011-12-06
      • 1970-01-01
      • 1970-01-01
      • 2012-02-17
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多