【发布时间】:2016-06-02 15:13:18
【问题描述】:
我有一个包含多个超链接的页面。我想得到的格式是:
<html>
<body>
<div id="diva">
<a href="/123" >text2</a>
</div>
<div id="divb">
<a href="/345" >text1</a>
<a href="/678" >text2</a>
</div>
</body>
</html>
我想提取三个href 123,345和678。
我知道如何使用$gm = $xpath->query("//a") 获取所有超链接,然后遍历它们以获取 href 属性。
是否有某种正则表达式可以仅获取具有上述格式的属性(即“/digits”)?
谢谢
【问题讨论】: