【问题标题】:Regex find every instance of element in html [duplicate]正则表达式在html中查找元素的每个实例[重复]
【发布时间】:2014-02-12 00:53:16
【问题描述】:

我正在抓取一个 html 页面,该页面在 div 元素 id="row-1" 内包含 X 个元素 class="page-title" 的实例

所以我们有类似的东西:

<div id="row-1">
    <div class="page-title">
        <span><h4><a>text I want to grab</a></h4></span>    
    </div>
</div>    

这些行可能有 1,2,3,10 个。如果有多行,谁能帮助解释我如何获取页面标题的每个实例?

【问题讨论】:

    标签: php html regex


    【解决方案1】:

    无论你做什么,都不要使用正则表达式! HE COMES

    改为使用解析器:

    $dom = new DOMDocument();
    $dom->loadHTML($your_html_source_here);
    $xpath = new DOMXPath($dom);
    $nodes = $xpath->query("//*[@id='row-1']/div[@class='page-title']");
    

    【讨论】:

      猜你喜欢
      • 2018-06-08
      • 1970-01-01
      • 2017-07-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-07-12
      • 1970-01-01
      相关资源
      最近更新 更多