【发布时间】:2026-01-04 16:30:02
【问题描述】:
我有一段我提取的 html 代码:
Server Address</span></td><td ><span class="hpPageText" >hostname0403.domain.tld</span></td><
我试图从这个字符串中提取 fqdn (hostname0403.domain.tld)。我想我会使用以下逻辑:
- 以 > 开头,以 结尾
- 必须包含至少 1 个句点(点)。
- 必须包含所有数字、所有字母或两者的组合。
我希望最终得到的是 ">hostname0403.domain.tld
$reg = ">[\w\.]+<"
我对正则表达式很陌生,虽然这确实有效,但我不确定它是否安全。任何帮助将不胜感激。
【问题讨论】:
-
仅作记录:不建议使用 RegEx 解析 HTML。但是为了帮助您,重要的是该 HTML-Stuff 的哪些部分改变了哪些部分不改变。
-
回应@DasKrümelmonster 所说的:请参阅this answer,了解为什么一般不应使用正则表达式来解析HTML。
-
Mybe 对你的目的来说有点矫枉过正,但我会去htmlagilitypack.codeplex.com
标签: c# .net regex powershell