【问题标题】:regex: filter out group starting by a certain string正则表达式:过滤掉以某个字符串开头的组
【发布时间】:2020-09-13 16:14:50
【问题描述】:

我要解析的文字如下:

<p class="p p1"><strong>Analysts</strong></p>\n<p class="p p1">Mark Troman - BofA Merrill Lynch, Research Division</p>\n<p class="p p1">Ben Uglow - Morgan Stanley, Research Division</p>

使用reg = &lt;p class="p p[1-9][0-9]{0,1}"&gt;(.+?)&lt;\/p&gt;,我可以得到两组:

  • &lt;strong&gt;Analysts&lt;/strong&gt;
  • Ben Uglow - Morgan Stanley, Research Division

但是,我想过滤掉以&lt;strong&gt; 开头并以&lt;/strong&gt; 结尾的组,并保留 Ben Uglow - Morgan Stanley, Research Division.

有没有办法重写正则表达式并在一行正则表达式中完成过滤?

【问题讨论】:

    标签: html regex


    【解决方案1】:

    我想过滤掉以

    开头的组

    此正则表达式应仅匹配不包含 &lt;strong&gt; 的组:

    &lt;p class="p p[1-9][0-9]{0,1}"&gt;([a-zA-Z0-9, -]+?)&lt;\/p&gt;

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-10-28
      • 2011-09-16
      • 2012-10-13
      • 1970-01-01
      相关资源
      最近更新 更多