【问题标题】:Regarding Regexp_replace - Oracle SQL关于 Regexp_replace - Oracle SQL
【发布时间】:2016-06-13 13:55:31
【问题描述】:

我正在使用以下查询将值 2 替换为 5。我的输入字符串将采用如下所示的格式。每个值将用胡萝卜(^)符号分隔。当没有重复值时它工作正常。但是对于重复的值,它不起作用。请指教。

select regexp_replace('1^2^2222^2','(^|\^)2(\^|$)','\15\2') OUTPUT from dual;

输出:

1^5^2222^5 ( Working Fine as there is no consecutive duplicates at the starting or at the end)

.

select regexp_replace('2^2^2222^2^2','(^|\^)2(\^|$)','\15\2') OUTPUT from dual;

输出:

5^2^^5^2222^5^2(Not working as there is consecutive duplicate at the starting/end)

请告诉我如何纠正这个问题?

【问题讨论】:

  • 你想要的输出的规则是什么?
  • ^ 符号是 caret
  • 谢谢。以后会保证的

标签: sql oracle oracle11g regexp-replace


【解决方案1】:

问题

问题是搜索字符串的第二个相邻出现不匹配。这是因为正则表达式的第一部分:

(^|\^)2(\^|$)
  ^
-- this is not matched when the text preceding "2" is a replaced string

解决方案

解决问题的一种方法是连续运行两次正则表达式:

SELECT REGEXP_REPLACE (tmpRes, '(^|\^)2(\^|$)', '\15\2') OUTPUT
FROM (
    -- first pass of replacement
    SELECT REGEXP_REPLACE ('2^2^2222^2^2', '(^|\^)2(\^|$)', '\15\2') tmpRes
    FROM DUAL
)

-- OUTPUT: 5^5^2222^5^5

【讨论】:

    【解决方案2】:

    为什么它不起作用

    当正则表达式解析字符串 2^2^2222^2^2 时,它将匹配字符串开头然后是 2^ 并将其替换为 5^。然后它将尝试从该匹配之后继续以生成更多匹配 - 字符串的下一部分是 2^ 但它不会匹配,因为它不在字符串的开头并且没有前导 ^ .

    相反,您可以通过将字符串(使用^ 作为分隔符)拆分为一个集合,然后对集合中的每个项目进行替换并将集合重新连接成一个字符串来实现。这可以通过hierarchical query 来完成,但实现一个简单的函数将使查询结果更易于阅读。

    Oracle 设置

    CREATE TYPE VARCHAR2_TABLE AS TABLE OF VARCHAR2(4000);
    /
    
    CREATE OR REPLACE FUNCTION split_String(
      i_str    IN  VARCHAR2,
      i_delim  IN  VARCHAR2 DEFAULT ','
    ) RETURN VARCHAR2_TABLE DETERMINISTIC
    AS
      p_result       VARCHAR2_TABLE := VARCHAR2_TABLE();
      p_start        NUMBER(5) := 1;
      p_end          NUMBER(5);
      c_len CONSTANT NUMBER(5) := LENGTH( i_str );
      c_ld  CONSTANT NUMBER(5) := LENGTH( i_delim );
    BEGIN
      IF c_len > 0 THEN
        p_end := INSTR( i_str, i_delim, p_start );
        WHILE p_end > 0 LOOP
          p_result.EXTEND;
          p_result( p_result.COUNT ) := SUBSTR( i_str, p_start, p_end - p_start );
          p_start := p_end + c_ld;
          p_end := INSTR( i_str, i_delim, p_start );
        END LOOP;
        IF p_start <= c_len + 1 THEN
          p_result.EXTEND;
          p_result( p_result.COUNT ) := SUBSTR( i_str, p_start, c_len - p_start + 1 );
        END IF;
      END IF;
      RETURN p_result;
    END;
    /
    

    查询

    SELECT LISTAGG( CASE COLUMN_VALUE WHEN '2' THEN '5' ELSE COLUMN_VALUE END, '^' )
             WITHIN GROUP ( ORDER BY ROWNUM )
    FROM   TABLE( split_String( '2^2^2222^2^2', '^' ) );
    

    输出

    5^5^2222^5^5
    

    【讨论】:

      【解决方案3】:

      正如其他人所说,问题是终止分隔符插入符与第一次出现匹配,因此它不被视为下一个实例的开始分隔符。

      如果您不想使用嵌套的正则表达式调用,您可以使用简单的替换来加倍分隔符,然后再剥离它们:

      replace(
        regexp_replace(
          replace(<value>, '^', '^^'), '(^|\^)2(\^|$)','\15\2'), '^^', '^')
      

      内部替换将您的值转换为2^^2^^2222^^2^^2,因此在匹配第一个匹配项后,仍然有一个插入符号作为第二个实例的开始分隔符,等等。外部替换只是将那些加倍的分隔符剥离回来单身。

      带有一些示例字符串:

      with t (input) as (
        select '1^2^2222^2' from dual
        union all select '2^2^2222^2^2' from dual
        union all select '2^2^2222^2^^2^2' from dual
      )
      select input,
        replace(
          regexp_replace(
            replace(input, '^', '^^'), '(^|\^)2(\^|$)','\15\2'), '^^', '^') as output
      from t;
      
      INPUT           OUTPUT             
      --------------- --------------------
      1^2^2222^2      1^5^2222^5          
      2^2^2222^2^2    5^5^2222^5^5        
      2^2^2222^2^^2^2 5^5^2222^5^^5^5     
      

      【讨论】:

        猜你喜欢
        • 2018-10-07
        • 2018-09-20
        • 2016-08-31
        • 2014-05-28
        • 2018-06-23
        • 2019-09-02
        • 2018-04-23
        • 2019-10-20
        • 1970-01-01
        相关资源
        最近更新 更多