【问题标题】:Adding XML element in XML file using sed command in shell script在 shell 脚本中使用 sed 命令在 XML 文件中添加 XML 元素
【发布时间】:2014-06-07 17:14:41
【问题描述】:

我正在使用 sed 命令将 xml 元素插入到现有的 xml 文件中。

我有xml文件

<Students>
    <student>
        <name>john</>
        <id>123</id>
    </student>
    <student>
        <name>mike</name>
        <id>234</id>
    </student>
</Students>

我想添加新的elememt为

    <student>
        <name>NewName</name>
        <id>NewID</id>
    </student>

所以我的新xml文件将是

<Students>
    <student>
        <name>john</>
        <id>123</id>
    </student>
    <student>
        <name>mike</name>
        <id>234</id>
    </student>
    <student>
        <name>NewName</name>
        <id>NewID</id>
    </student>
</Students>

为此,我将 shell 脚本编写为

#! /bin/bash

CONTENT="<student>
            <name>NewName</name>
            <id>NewID</id>
        </student>"

#sed -i.bak '/<\/Students>/ i \ "$CONTENT" /root/1.xml
sed -i.bak '/<\/Students>/ i \'$CONTENT'/' /root/1.xml

我收到错误

sed: can't read <name>NewName</name>: No such file or directory
sed: can't read <id>NewID</id>: No such file or directory
sed: can't read </student>: No such file or directory

而在xml文件中,只添加了&lt;student&gt;。 不添加其余元素。 有谁知道为什么会出现这个错误?

【问题讨论】:

  • 存在多种工具来操作 XML 文件。使用这些而不是正则表达式。
  • @devnull 很高兴您能列出其中的一个(或两个)工具

标签: xml bash shell sed


【解决方案1】:

改变这个:

CONTENT="<student>
            <name>NewName</name>
            <id>NewID</id>
        </student>"

到这里:

CONTENT="<student>\n<name>NewName</name>\n<id>NewID</id>\n</student>"

然后:

C=$(echo $CONTENT | sed 's/\//\\\//g')
sed "/<\/Students>/ s/.*/${C}\n&/" file

【讨论】:

  • 如果我的标签是New Name,那么这里怎么处理空格呢? '\t' 将添加一个选项卡,我需要单个空格
  • @USer007 你可以用反斜杠空格转义空格字符
【解决方案2】:

您不能在 sed 替换文本中使用未转义的换行符,即您的示例中的 $CONTENT。 sed 像 shell 一样使用换行符来终止命令。

如果您需要在替换文本中使用换行符,则需要在其前面加上反斜杠。

还有另一种使用r 选项添加文本的方法。例如:

假设您的主文件是;

$ cat file
<Students>
    <student>
        <name>john</>
        <id>123</id>
    </student>
    <student>
        <name>mike</name>
        <id>234</id>
    </student>
</Students>

您要添加的文本在另一个文件中(不是变量):

$ cat add.txt
    <student>
        <name>NewName</name>
        <id>NewID</id>
    </student>

你可以这样做(使用gnu sed):

$ sed '/<\/Students>/{ 
    r add.txt
    a \</Students>
    d 
}' file
<Students>
    <student>
        <name>john</>
        <id>123</id>
    </student>
    <student>
        <name>mike</name>
        <id>234</id>
    </student>
    <student>
        <name>NewName</name>
        <id>NewID</id>
    </student>
</Students>

但是,在给出了这个选项后,用正则表达式解析 xml 仍然是一个非常糟糕的主意。它使解决方案非常脆弱且易于破坏。仅将其视为学习练习。

【讨论】:

    【解决方案3】:

    这可能对你有用(GNU sed 和 Bash):

    CONTENT='    <student>\
        <name>NewName</name>\
        <id>NewID</id>\
    </student>'
    
    sed '/<\/Students>/i\'"$CONTENT" file
    

    或者,将新学生放在一个文件中,然后:

    sed '/<\/Students>/e cat new_student_file' file
    

    【讨论】:

    • 这里如果标签类似于新名称,那么我该如何处理这个空格。
    • @Optimus 变量只需记住每行的最后一个字符(但最后一个)必须以 `\` 结尾。对于文件解决方案,只需编写您看到的文本即可。