【发布时间】:2020-11-02 10:48:16
【问题描述】:
我有一个带有代码的 html 页面:
<div id="content">
<nav>some menu</nav>
<article>
<img src="photo.jpg" />
<h1>Title</h1>
<div class="articleContent">
<p>text,text,text</p>
<h4>sub title</h4>
<p>text,text,text</p>
<img src="">
<p>text,text,text</p>
</div>
</article>
</div>
我想获得带有所有 html 标签的 div.articleContent:
<p>text,text,text</p>
<h4>sub title</h4>
<p>text,text,text</p>
<img src="photo.jpg">
<p>text,text,text</p>
我的代码:
$html = new DOMDocument;
$html = file_get_contents('url.html');
$dom = new DomDocument();
@ $dom->loadHTML($html);
$xpath = new DOMXpath($dom);
$content = $xpath->query("//div[@class='articleContent']");
但我只得到纯文本:
文字,文字,文字副标题文字,文字,文字文字,文字,文字
【问题讨论】:
-
这可能就是你要找的东西:stackoverflow.com/a/6739848/10116997
-
其他人可以帮助我吗?
-
我提出了一个答案,希望对您有所帮助
-
你试过
$content->item(0)->c14n();吗?