【问题标题】:Captured group in regular expression is more than matched string?正则表达式中捕获的组超过匹配的字符串?
【发布时间】:2018-05-11 10:03:39
【问题描述】:

我查看了gsub 的文档:

返回 str 的副本,其中所有出现的模式都被替换 对于第二个参数。

在块形式中,当前匹配字符串作为一个 参数,并设置 $1、$2、$`、$& 和 $' 等变量 适当地。块返回的值将被替换为 每次通话的比赛。

我有这个例子:

"new-york".gsub(/(-|\A)./) do |m|
  m #=> "n", "-y"
  m[-1].upcase
end
 #=> "NewYork" 

捕获的组m 是连字符或起始字符。起始字符是"n"。唯一捕获的其他项目应该是连字符"-"。输出捕获"-y" 而不仅仅是"-""y" 既不是连字符也不是开始字符。为什么会被捕获?

【问题讨论】:

  • 术语 matchcapture 在正则表达式中具有不同的含义,因此请注意如何使用它们。 \A 也不是一个字符。 /-|\A./ 将匹配连字符或起始字符。即'new-york'.scan(/-|\A./) #=> ["n", "-"]
  • @SagarPandya OP 有/(-|\A)./,而不是/-|\A./
  • @sawa 我写了我的正则表达式来展示如何匹配任何- 字符或第一个字符,因为这是 OP 错误地认为他的正则表达式所做的:“捕获的组 m 是连字符或起始字符...等”。

标签: ruby regex pattern-matching


【解决方案1】:

(第一个)捕获的组对应于正则表达式(-|\A) 中的(第一)对括号,即"""-"。这是$1。注意\A 是一个位置,而不是一个字符;它不是"n",而是"n"之前的空字符串""

匹配是对应于您的整个正则表达式(-|\A).,即"n""-y"。这是m

【讨论】:

  • 让我换个方式问这个问题。为什么不返回 ay: 'new-york'.scan(/-|\A./) #=> ["n", "-"] => ["n", "-"]
  • 因为您的正则表达式中的- 选项仅匹配"-"
  • 现在说得通了。 \A 指第一个字符之前的位置。而且由于正则表达式同时使用 \A 和 .字符(除换行符之外的任何字符),它匹配“”(第一个字符之前的位置)和“n”(下一个字符)。这将返回为“n”。同样的逻辑用于获取“-y”。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2021-04-08
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2017-03-30
  • 2021-09-20
  • 1970-01-01
相关资源
最近更新 更多