【问题标题】:HTML DOM extracting content by Parrent to Child relationHTML DOM 通过父子关系提取内容
【发布时间】:2026-02-13 10:30:02
【问题描述】:

我想使用 PHP 解析 HTML DOM;

我有一个字符串 PN,我想检测 DOM 元素的 Parrent,其中 PN 被找到为内容;

然后,找到 Parrent 元素后,我需要这些元素的所有子元素;

所有其他不在Parrent结构下的DOM元素,必须忽略;

【问题讨论】:

  • 要获得帮助,您必须展示一些代码和一些研究。

标签: php html dom


【解决方案1】:

这是我设法写的,但我不知道在 $node-> 之后要写什么以获得元素 (h1,h2,div,span) ...

//start xpath
// Create new DOM object:
$dom = new DomDocument();
// Load HTML code:
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$nodes = $xpath->query('//*');
$data = array();
foreach ($nodes as $node) {
    $data[] = $node->textContent;
}
if( count( $data ) > 0 )
{
echo '<br/>xpath<br/>';
print_r( $data );
}
//stop xpath

【讨论】: