【发布时间】:2011-08-14 14:27:02
【问题描述】:
假设我有如下字符串:
<a>b<c>
我想同时删除<a> 和<c>,但我不能使用gsub("<.*>","","<a>b<c>"),因为这也会删除b。
我之前问过一个类似的问题,但转念一想,我认为我应该总体上学习如何处理这类问题。谢谢。
【问题讨论】:
-
更通用的解决方案是使用解析器。除非您可以确定没有转义符号、每个符号都匹配、不会发生嵌套以及许多其他警告,否则最好使用解析器。关于正则表达式和 HTML 有一个非常著名的问题。虽然您没有提到 HTML,但看起来您可能正朝着 HTML 和 XML 等标记语言的方向前进。