【发布时间】:2011-12-08 10:43:00
【问题描述】:
必须编写一个匹配以下内容的正则表达式:
<a href="../../_asp/link.asp?link=sp1234.htm
和
<a href="../../_asp/link.asp?link=AL432123.htm
“=”之后只能是“AL”或“sp”字符串,.htm 之前可以是任意数量的数字
会是这样的:
Regex reg = new Regex("<a href=\"../../_asp/link.asp?link=(AL|sp)[0-9]+.htm");
对正则表达式了解不多,要尽快写这一篇。 htm 文件中的这个子字符串需要用另一个字符串替换。谢谢!
【问题讨论】:
-
您为什么要尝试使用正则表达式解析 HTML?这通常是一个非常糟糕的主意。如果可能,请使用适当的 HTML 解析器,例如 HTML Agility Pack。