【发布时间】:2011-12-21 12:01:31
【问题描述】:
通过所见即所得的文本编辑器,我插入带有“评论”类的跨度标签。我想从字符串中删除 span 标签及其内容的任何实例
那么我如何从这里得到:
string content = "<p>sadf<span class="otherclass"><span class="comment">asdfsdafsdafsadfsdf</span></span></p>";
到这里:
content = "<p>sadf<span class="otherclass"></span></p>";
我知道 HTMLAgilityPack,但不想增加我控制的 HTML 的开销。我更喜欢正则表达式解决方案。
编辑:我只想删除带有“评论”类的跨度。
【问题讨论】:
-
为什么您认为添加旨在解决您遇到的问题的库会产生开销?正则表达式不适合解析 HTML,这是一个公认的事实,因为它不能保证格式正确。
-
我认为不应该仅仅因为标准是强制的,就应该延续不良做法。
-
因为这似乎是一个简单的正则表达式解决方案。两个带有“comment”类的span标签之间永远不会有任何HTML,只有文本。我只是不擅长正则表达式。假装它不是 HTML。
标签: c# .net regex html-parsing