【发布时间】:2015-10-04 13:37:18
【问题描述】:
这是我拥有的数据:
This is a test/><STUFF
This is a test/><TRY
我正在尝试使用 sed 在 bash 中摆脱 /><STUFF 和 /><TRY。
所以结果有两个句子。
This is a test
This is a test
【问题讨论】:
-
文字总是这样吗?你总是想从第一个斜杠中删除吗?如果不是这种情况,请澄清它不要依赖于此获得答案。
-
看起来您实际上是在使用一些 HTML/XML...
-
@TomFenech,不一定。此类数据可能是通过 HTML 文件进行 grepping 的输出,因此使用正则表达式并不是一个坏主意。是否应该首先对 HTML 文件进行 grep 是另一回事 - 我想这取决于文件本身以及要实现的目标。
-
is 始终是结束或其他可能出现的两个单词之一(除了单词,尤其是在一行中出现两次的
/)?