【问题标题】:Inconsistent behavior in Ruby gsub replacement?Ruby gsub 替换中的行为不一致?
【发布时间】:2014-07-10 00:32:24
【问题描述】:

两个 gsub 产生不同的结果。谁能解释一下为什么?

代码也可通过https://gist.github.com/franklsf95/6c0f8938f28706b5644d 获得。

    ver = 9999
    str = "\t<key>CFBundleDevelopmentRegion</key>\n\t<string>en</string>\n\t<key>CFBundleVersion</key>\n\t<string>0.1.190</string>\n\t<key>AppID</key>\n\t<string>000000000000000</string>"
    puts str.gsub /(CFBundleVersion<\/key>\n\t.*\.).*(<\/string>)/, "#{$1}#{ver}#{$2}"
    puts '--------'
    puts str.gsub /(CFBundleVersion<\/key>\n\t.*\.).*(<\/string>)/, "#{$1}#{ver}#{$2}"

我的红宝石版本是ruby 2.1.2p95 (2014-05-08 revision 45877) [x86_64-darwin13.0] (MRI)。在我的机器上,结果是:

<key>CFBundleDevelopmentRegion</key>
<string>en</string>
<key>9999
<key>AppID</key>
<string>000000000000000</string>
--------
<key>CFBundleDevelopmentRegion</key>
<string>en</string>
<key>CFBundleVersion</key>
<string>0.1.9999</string>
<key>AppID</key>
<string>000000000000000</string>

第二个是想要的效果,但是第一个错了。

【问题讨论】:

    标签: ruby regex gsub


    【解决方案1】:

    这与时间以及 ruby​​ 正则表达式的工作方式有关。

    gsub 设置 $1$2,但要等到它完成之后。因此,当您第一次运行时,它们是空白的。当你第二次运行时,它们是由之前的gsub 设置的。如果您想就地进行正则表达式捕获,则需要\1\2,如下所示:

    puts str.gsub /(CFBundleVersion<\/key>\n\t.*\.).*(<\/string>)/, '\1' + ver.to_s + '\2'
    

    【讨论】:

    • 很高兴知道,+1 :)
    • 也可以使用gsub的块形式:str.gsub(/(CFBundleVersion&lt;\/key&gt;\n\t.*\.).*(&lt;\/string&gt;)/) {"#{$1}#{ver}#{$2}"}
    • 你能更明确地解释一下 '\1' 和 "$1" 之间的区别吗?谢谢!
    • 我的理解是,当您将 args 传递给 gsub 时,会在执行对 gsub 的调用之前评估 $1 和 $2,然后将其作为参数传递给 gsub。 \1 和 \2 对 ruby​​ 本身没有任何特殊含义,但 gsub 识别它们并处理它们的方式与 perl 在类似情况下处理 $1 和 $2 的方式相同。
    【解决方案2】:

    如果你使用 gsub() 的块形式,你的代码会正常工作:

    ver = 9999
    
    str = "\t<key>CFBundleDevelopmentRegion</key>\n\t<string>en</string>\n\t<key>CFBundleVersion</key>\n\t<string>0.1.190</string>\n\t<key>AppID</key>\n\t<string>000000000000000</string>"
    
    puts str.gsub(/(CFBundleVersion<\/key>\n\t.*\.).*(<\/string>)/) {|match|
      "#{$1}#{ver}#{$2}"
    }
    
    puts '-' * 20
    
    puts str.gsub(/(CFBundleVersion<\/key>\n\t.*\.).*(<\/string>)/) {|match|
      "#{$1}#{ver}#{$2}"
    }
    
    --output:--
        <key>CFBundleDevelopmentRegion</key>
        <string>en</string>
        <key>CFBundleVersion</key>
        <string>0.1.9999</string>
        <key>AppID</key>
        <string>000000000000000</string>
    --------------------
        <key>CFBundleDevelopmentRegion</key>
        <string>en</string>
        <key>CFBundleVersion</key>
        <string>0.1.9999</string>
        <key>AppID</key>
        <string>000000000000000</string>
    

    文档描述了这种行为:

    如果替换是一个字符串, ... 但是,在替换中,特殊匹配变量,例如 $&, 不会引用当前匹配。

    ...

    在块形式中,当前匹配字符串作为一个 参数,并设置 $1、$2、$`、$& 和 $' 等变量 适当地。块返回的值将被替换 每次通话的比赛。

    【讨论】:

    • 是不是因为正则表达式匹配是在block执行之前完成的,而在参数以非block形式传递给gsub时没有完成?
    • ^ 好像是这样的。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2018-12-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-12-26
    • 2021-08-19
    • 2017-02-01
    相关资源
    最近更新 更多