【发布时间】:2018-09-05 06:36:53
【问题描述】:
我有一个 html 文件,该文件包含 html 标签我想选择所有具有特定公式的锚点,该公式如下所示
<a href="AnyTextHereFollowingByThatChar/" target="_blank">
我像下面这样写正则表达式
\<a\s*href\=\"(.*?)"\s*target\="_blank"
但是这个正则表达式选择它匹配的第一个锚点,直到在任何其他锚点上找到关键字目标,然后在选择中间的所有字符后停止。
感谢任何帮助抓住这些锚
<a href="AnyTextHereFollowingByThatChar/" target="_blank">
【问题讨论】:
-
正则表达式 html 存在问题,如果它嵌套在更大的 html 文档 ID 中,请考虑使用 html-agility-pack.net
-
这是什么 html-agility-pack.net @TheGeneral
-
它是一个专用的 Jedi html 解析库,可以轻松解决您的 html 难题。嗯...经过一个突然的学习曲线和几个 SO 问题
-
其次,不要尝试使用直接正则表达式来执行此操作。 HtmlAgilityPack 将让您提取您正在寻找的元素和属性的对象表示,可以以您尝试的方式更安全地查询。
-
用正则表达式解析 HTML 可能会有unfortunate effects的心理状态:别这样。