【发布时间】:2012-10-04 07:31:16
【问题描述】:
我只需要有人纠正我对这个正则表达式的理解,这就像匹配 HTML 标签的权宜之计。
< (?: "[^"]*" ['"]* | '[^']*'['"]*|[^'">])+ >
我的理解-
-
<- 匹配标签打开符号 -
(?:- 无法理解这里发生了什么。这些符号是什么意思? -
"[^"]*['"]*双引号中的任意字符串。还有其他事情吗? -
'[^']*'['"]*- 单引号中的一些字符串 -
[^'">]- ' " > 以外的任何字符。
所以它是一个 ' 的字符串,重复一次或多次后跟一个 '>'。
那是我能做出来的最好的了。
【问题讨论】:
-
我认为您的理解看起来不错。但是对于所有正则表达式,您应该让自己成为一个“常规表达式测试员”并检查一些场景以确保(我使用了一个可以完成这项工作的 firefox 插件)。
标签: regex html-parsing