【发布时间】:2012-06-08 07:21:34
【问题描述】:
从一组超过 10000 行的文本中,我需要找到缺少一组 html 标记后空格的所有字符串实例。 HTML 标记集有限,如下所示。
<b> </b>, <em> </em>, <span style="text-decoration: underline;" data-mce-style="text-decoration: underline;"> </span>
<sub> </sub>, <sup> </sup>, <ul> </ul>, <li> </li>, <ol> </ol>
运行 Regx 后,结果应该会出现以下字符串。
Hi <b>all</b>good morning.
在这种情况下,我们在粗体标记后遗漏了 sapce。
【问题讨论】:
-
我看不出你怎么可能期望那个输入的输出,除非你对输出进行硬编码。 -1 表示尝试将正则表达式用于众所周知的需要堆栈的操作。
-
您已将 C# 和 JavaScript 都标记了 - 您使用的是哪种语言?
-
@bdares:这非常适合正则表达式。至少如果我正确理解了这个问题。
-
@bdares 输出不需要我,只需要找到所有存在此类字符串的实例。
-
这是一个很好的问题,只是措辞不好,所以人们会误解所问的内容。他说只有上面的一组标签,他需要正则表达式来确保它们之间有间隔,所以他最终不会得到像 Hi all> 这样的东西,而是得到 Hi all ,因为这是使用 html,我猜这是一个 Web 应用程序,因此同时使用 c#(他正在使用的语言)和 javascript,因为他很乐意使用 javascript 脚本来实现这一点。
标签: c# javascript regex