【发布时间】:2015-10-04 19:51:25
【问题描述】:
我无法弄清楚在 html 标记之间获取文本。在我的场景中,除了段落标签<p>之外,所需的文本不包含在标签之间。
<div class="entry clearfix">
<p>111</p>
<p><img class="alignnone size-medium wp-image-38376" src="1.jpg" alt="Talvar" /></p>
<p><strong>111: </strong>111<br/>
<strong>111:</strong> 111<br/>
<strong>111:</strong> 111 111<br/>
<strong>111: </strong>111<br/>
<strong>111: </strong>1111
</p>
<p><strong>111</strong></p>
<p>
<strong>01 –</strong> data1 <strong><a href="#">Download</a><br/>
</strong><em>222</em><br/>
<strong>02 –</strong> data2 <strong><a href="#">Download</a><br/>
</strong><em>222</em><br/>
<strong>03 –</strong> data3 <strong><a href="#">Download</a><br/>
</strong><em>222</em><br/>
<strong>04 –</strong> data4 <strong><a href="#">Download</a><br/>
</strong><em>222</em>
</p>
<p><strong>222</strong></p>
<p><strong><a href="" target="_blank">3333</a></strong></p>
<p><strong>eb</strong></p></div>
我需要数据 1、数据 2、数据 3、数据 4。为此,我找到了<p>,它是数组 4 中的第 5 号。
foreach($html->find('div[class="entry"]') as $row){
$a = $row->find('p',4);
echo $dt = $a->find('text',1)->plaintext; // returns me only data1
}
data1、data2、data3、data4 不在除<p> 之外的任何标签之间,如果我通过striptags() 获取它们,它会返回所有文本以及 111、下载、222 等。请告知我如何获取数据系列。
【问题讨论】: