【发布时间】:2013-02-20 16:25:04
【问题描述】:
我需要一个字符串来选择所有 html 标记文本编号所有内容,除了在锚结束标记中发现的随机出现的单词,这一行 rel="bookmark">RANDOM WORDS</a></h1>
我尝试了字符串[<0-9a-zA-z/=|"-:.*?>],它选择了字面上的所有内容,它发现没关系,但我需要一个排除随机词的字符串,在上述行中找到的选择中。
【问题讨论】:
-
现在是 2013 年。停止使用正则表达式解析 HTML。使用 XML 解析器。
-
<center>撑不住了,来不及了…… -
这是一个重复的问题。在这里查看答案:stackoverflow.com/a/1732454/1123744