【发布时间】:2015-03-04 21:54:06
【问题描述】:
我有一个 xml 文件,我需要在其中保持标签的顺序,但有一个名为 media 的标签,它具有连续顺序的重复行。我想删除一个重复的媒体标签,但想保留所有的父标签 - (它们也是连续的和重复的)。我想知道是否有一个 awk 解决方案仅在模式匹配时才删除。例如:
<story>
<article>
<media>One line</media>
<media>One line</media> <-- Same line as above, want to delete this
<media>Another Line</media>
<media>Another Line</media> <-- Another duplicate, want to delete this
</article>
</story>
<story>
<article>
........ and so on
我想保留连续的故事和文章标签,只删除媒体标签的重复项。我尝试了许多 awk 脚本,但如果不对文件进行排序并破坏 xml 的顺序,似乎什么都不起作用。非常感谢任何帮助。
【问题讨论】:
-
不是一个明确的例子。请将您的
as above符号移动到您的 cmets 中。