【发布时间】:2012-01-04 16:25:59
【问题描述】:
我正在尝试使用 simplehtmldom 来解析带有许多 li 标签的网页。
我只想提取出现在以下 sn-p 中的特定标签 <li class='ev_td_li c5'> 的内部文本:
<li class='ev_td_li c5'>10:00
<a class="ev_link_row c3" href="/fr/quoi-faire-a-sutton/programme-activites-sutton/calendrier-hebdomadaire/icalrepeat.detail/2012/01/01/13918/-/NTNkZDVjNzNiNzE1YTBmM2VhZjMyZjljNmU0ODFiNjQ=.html"
title="Marche du 2012">Marche du 2012</a>::
<a class="ev_link_cat c4" href="/fr/quoi-faire-a-sutton/programme-activites-sutton/calendrier-hebdomadaire/week.listevents/2012/01/02/122.html"
title="Outdoor, Sporting Events ">Outdoor, Sporting Events</a>
</li>
如果我使用以下代码,我会得到所有的“li”标签:
foreach($html->find('li') as $e){
echo $e->innertext . '<br>';
但如果我尝试按以下方式添加类,我不会得到任何输出:
foreach($html->find('li.ev_td_li c5') as $e){
echo $e->innertext . '<br>';
我想知道“li.ev_td_li c5”中的空格字符是否是问题所在。
有谁知道我做错了什么? 谢谢 艾略特
【问题讨论】:
标签: php parsing screen-scraping simple-html-dom