【发布时间】:2013-02-28 00:15:11
【问题描述】:
我想解析来自网站的新闻:http://www.bakirkoykhb.gov.tr/?module=bizden_haberler,我面临的是该网站有很多没有类的表,而且非常复杂等等,如果你查看源代码就可以看到页面,我得到了类似的标题:
Japonya-Türkiye Tıp Derneği'den Ziyaret
Saglik-Sen Gen. Başk.Memiş'ten Ziyaret
Vali Mutlu' dan Ziyaret
等等,下面是我的代码。但我不知道如何解析“Devamını Oku”下包含的链接。
$html = file_get_html('http://www.bakirkoykhb.gov.tr/?module=bizden_haberler');
$j = 0;
foreach($html->find('b') as $element2){
echo "
<h3 ><a target=\"_blank\" href=\"#somethingtohere\">". $element2->plaintext . "</a></h3>
";
$j++;
if($j > 5) break;
}
希望你能帮忙,谢谢。
【问题讨论】:
-
根据包含
$element2->plaintext的内容,您可以使用preg_match和有效的正则表达式来提取您需要的部分
标签: php parsing simple-html-dom domparser