拆分分隔符分隔的字符串并插入到oracle 11中的表中答案

【问题标题】：Split delimiter separated string and insert into a table in oracle 11拆分分隔符分隔的字符串并插入到oracle 11中的表中
【发布时间】：2023-06-07 14:07:02
【问题描述】：

我有分隔符分隔的输入字符串，它可以有大约 40 个标记（数量可能会增加），我想使用 oracle 11 中的存储过程将这些值插入到表中；最好的方法是什么

创建一个包含 40 个 IN 参数的 SP 并使用它来插入。

创建一个带有 1 个 IN 参数的 SP，它将采用该字符串并拆分分隔符分隔的标记并将它们插入到表中

如果第二种方法看起来不错，那么请建议如何实现它？？

例如，如果一个字符串类似于"abc,123,xyz,pqr,12"（这里的分隔符是逗号）所以在运行 SP 我的表 table1(A varchar2, B Number, C varchar2, D varchar2, E number ) 应该有类似的条目

A  | B | C | D | E
abc|123|xys|pqr |12

我想出了以下解决方案，不确定性能，有没有更好的方法来做同样的事情？

declare
  string_to_parse varchar2(2000) := 'abc,123,xyz,pqr,12';
  A varchar2(4);
  B number;
  C varchar2(4);
  D varchar2(4);
  E number;
begin

  string_to_parse := string_to_parse||',';

   A  := REGEXP_SUBSTR(string_to_parse,'[^,]+', 1, 1);
   B  := TO_NUMBER(REGEXP_SUBSTR(string_to_parse,'[^,]+', 1, 2));
   C  := REGEXP_SUBSTR(string_to_parse,'[^,]+', 1, 3);
   D  := REGEXP_SUBSTR(string_to_parse,'[^,]+', 1, 4);
   E  := TO_NUMBER(REGEXP_SUBSTR(string_to_parse,'[^,]+', 1, 5));
   dbms_output.put_line('A ' || A || ' B ' || B || ' c ' || c || ' D ' || D || ' E ' || E);
--insert into table
end;

【问题讨论】：

这和 Java 有什么关系？
移除了 java 标签
您的单位/管理层必须认真考虑将您的 Oracle 数据库升级到最新版本（或至少升级到 Oracle 11）。 Oracle 9 在当今世界是原始且过时的。
对不起，我们将在我的本地使用 oracle 11..9。编辑问题
我想问题是，为什么输入是分隔字符串？在过程中的某个时刻，您必须具有离散数据值。为什么不让它们保持离散并像这样将它们传递到数据库？

标签： regex oracle stored-procedures plsql

【解决方案1】：

在这种特殊情况下，分裂离目标还有很长的路要走。考虑到一个目标表可能有很多列（是的，5 个列在一个不同的变量中处理每个列都太多了），我建议使用模式字典来增加一些灵活性。

让我们看一个带有两个参数的过程：一个表名和一个包含逗号分隔值列表的字符串。这里假设该表只有字符串、数字和时间列。要实现完整版本，请在程序开始时添加对所有必需数据类型的处理。

注意，在中间我们使用标准 SQL 方法将一个字符串拆分为一个子字符串表：

select level as column_id, 
       REGEXP_SUBSTR(pi_values_list, '[^,]+', 1, level) as column_val 
  from dual connect by REGEXP_SUBSTR(pi_values_list, '[^,]+', 1, level) is not null;

这是整个过程：

  create or replace procedure myInsertInto(pi_table_name  char,
                                           pi_values_list char)
  is
    v_statement     varchar2(30000) := 'INSERT INTO %TABLE_NAME% (%COLUMNS_LIST%) VALUES (%VALUES_LIST%)';
    v_columns_list  varchar2(10000);
    v_values_list   varchar2(10000);
  begin

    SELECT LISTAGG(T.column_name, ',') within group (order by T.column_id) ,
           LISTAGG( -- implement specific types handling here
                    CASE
                    WHEN S.column_val IS NULL
                      THEN 'NULL'
                    WHEN T.data_type = 'NUMBER'
                      THEN S.column_val
                    WHEN T.data_type IN ('DATE', 'TIMESTAMP') 
                      THEN 'TIMESTAMP ''' || S.column_val || ''''
                    WHEN T.data_type like '%CHAR%' 
                      THEN '''' || S.column_val || ''''                    
                    ELSE 'NULL'
                    END, 
           ',') within group (order by T.column_id)
    into v_columns_list,
         v_values_list
    from user_tab_cols T,
         (select level as column_id, REGEXP_SUBSTR(pi_values_list, '[^,]+', 1, level) as column_val 
            from dual connect by REGEXP_SUBSTR(pi_values_list, '[^,]+', 1, level) is not null) S
   where T.table_name = pi_table_name
     and T.column_id = S.column_id;

    if v_columns_list IS NULL then
      raise_application_error(-20000, 'Not found columns for table ' || pi_table_name);
    end if;

    -- finalizing the statement
    v_statement := replace(v_statement, '%TABLE_NAME%', pi_table_name);      
    v_statement := replace(v_statement, '%COLUMNS_LIST%', v_columns_list);      
    v_statement := replace(v_statement, '%VALUES_LIST%', v_values_list);

    execute immediate v_statement;
  end;
  /

那就这样用吧

create table MY_TABLE (
  col_a VARCHAR2(10),
  col_b NUMBER,
  col_c VARCHAR2(10),
  col_d DATE,
  col_E VARCHAR2(10) default 'DEFAULT'
);



begin
  myInsertInto('MY_TABLE', 'abc,123,xyz,2018-01-02 23:01:10,pqr' );
  myInsertInto('MY_TABLE', 'def,345,mkr' );
  myInsertInto('MY_TABLE', 'fgh' );
end;
/

【讨论】：

【解决方案2】：

第一种方法是禁止的。

第二个可能有效。简单地说：

将输入字符串分配给变量 s。

现在，循环中：

如果 s 的长度为 0，则退出循环
使用 instr 查找第一次出现的分隔符 (',')。将其分配给 X
如果 X = 0，则 X := len(string) + 1
X := X - 1
如果 X > 0，则将 substr(s, 1, X) 插入表中
如果 X > 0，则 s := substr(s, X+1, len(s))

我没有对其进行测试，并且有明显的优化方法（例如 - 您可以存储当前解析部分的“左端索引”，而不是将子字符串分配回 s。

但是有更好的方法——用纯 sql 来做。不幸的是，我不知道你的oracle版本是否支持所有功能，但试试这个选择：

with 
my_input_string as (
   select 'my,delimited,,,,,,input,string' s from dual
),
string_to_rows as (
   select trim(regexp_substr(s, '[^,]+', 1, LEVEL)) col 
    from my_input_string
 connect by instr(my_input_string.s, ',', 1, LEVEL - 1) > 0
)
select *
  from string_to_rows
 where col is not null

如果它有效（我的意思是“有效” - 返回四行），只需在插入中使用它。用过程的参数替换硬编码的字符串，就是这样。

【讨论】：

感谢您的回复，但代码 sn-p 在 oracle 中无法正常工作
显然您的版本不支持分层查询和/或 with 子句。 with 子句很容易解决 - 只需将查询更改为使用子查询而不是 CTE。这里有一些其他技巧，如何将分隔字符串映射到行中：lalitkumarb.wordpress.com/2014/12/02/…
"'第一种方法是禁止的。" 比传递连接的字符串要少。
@APC 如果您的输入首先是串联的字符串，那么无论如何您都不会拯救世界。您只委派了在过程外部拆分字符串的责任（您可以在其中犯所有与内部相同的错误），现在您有一个包含 40 个参数、40 组插入值的过程，并且您有每当参数数量增加时（过程调用、过程定义和过程主体中的任何内容），至少在 3 个位置修改您的代码。我同意这种观点，但世界并不完美。
但是世界不是以逗号分隔的字符串开始的。数据库处理离散数据值，应用程序也是如此。有些东西连接了那些以前离散的值。这就是问题的根源。