【发布时间】:2012-08-19 00:32:01
【问题描述】:
我有一个 HTML 字符串,在这个例子中它看起来像
<img src="somepic.jpg" someAtrib="1" >
我正在尝试锻炼一个匹配“img”节点的正则表达式,并在节点末尾应用一个斜线,使其看起来像。
<img src="somepic.jpg" someAtrib="1" />
这里的最终目标基本上是确保节点是关闭的,打开的节点在 HTML 中有效,但显然不是 XML。有没有正则表达式爱好者可以提供帮助?
【问题讨论】:
-
你不应该parse (X)HTML with regex.。 HTML 不是正则的,因此不适合正则表达式。使用成熟的 HTML 解析器。
-
@DavidB 我明白你在说什么。但是我试图操纵一个“字符串”,这就是我问这个问题的原因:)
-
原始标记无效,请求的 XHTML 标记也无效。您的意思是“格式良好”而不是“有效”吗?
标签: javascript html xml parsing xhtml