【问题标题】:Split string with two delimiters and convert type使用两个分隔符拆分字符串并转换类型
【发布时间】:2015-01-24 17:50:39
【问题描述】:

我有一个这样的 PL/pgSQL 函数(感谢使这成为可能的人):

 CREATE OR REPLACE FUNCTION public.split_string(text, text)
    RETURNS SETOF text
    LANGUAGE plpgsql
    AS $function$
    DECLARE 
      pos int; 
      delim_length int := length($2);
    BEGIN
      WHILE $1 <> ''
      LOOP
        pos := strpos($1,$2);
        IF pos > 0 THEN
          RETURN NEXT substring($1 FROM 1 FOR pos - 1);
          $1 := substring($1 FROM pos + delim_length);
        ELSE
          RETURN NEXT $1;
          EXIT;
        END IF; 
      END LOOP;
      RETURN;
    END;
    $function$

它用分隔符分割字符串。像这样:

select * from split_string('3.584731 60.739211,3.590472 60.738030,3.592740 60.736220', ' ');

"3.584731"
"60.739211,3.590472"
"60.738030,3.592740"
"60.736220"

如何将结果保存在 temp_array 或 temp_table 中。所以我可以在 temp_x 中得到结果并再次拆分这些点。喜欢:

"3.584731"
"60.739211"
"3.590472"
"60.738030"
"3.592740"
"60.736220"

并将值返回为double precision。而这一切都应该在函数中完成。

【问题讨论】:

  • 你的 Postgres 版本对于这样的问题是必不可少的。另外,请提供您认为需要 plpgsql 的理由。

标签: postgresql plpgsql set-returning-functions


【解决方案1】:

如果需要中间步骤:

SELECT unnest(string_to_array(a, ' '))::float8
       -- or do something else with the derived table
FROM   unnest(string_to_array('3.584731 60.739211,3.590472 60.738030', ',')) a;

这比regexp_split_to_table() 更详细,但可能仍然更快,因为正则表达式通常更昂贵。 (使用EXPLAIN ANALYZE 进行测试。)

我首先在',' 拆分,然后在' ' 拆分-您描述的相反顺序似乎更合适。

如果需要,您可以将其包装到 PL/pgSQL 函数中:

CREATE OR REPLACE FUNCTION public.split_string(_str text
                                             , _delim1 text = ','
                                             , _delim2 text = ' ')
  RETURNS SETOF float8 AS
$func$
BEGIN
   RETURN QUERY
   SELECT unnest(string_to_array(a, _delim2))::float8
          -- or do something else with the derived table from step 1
   FROM   unnest(string_to_array(_str, _delim1)) a;
END
$func$ LANGUAGE plpgsql IMMUTABLE;

或者只是一个 SQL 函数:

CREATE OR REPLACE FUNCTION public.split_string(_str text
                                             , _delim1 text = ','
                                             , _delim2 text = ' ')
  RETURNS SETOF float8 AS
$func$
   SELECT unnest(string_to_array(a, _delim2))::float8
   FROM   unnest(string_to_array(_str, _delim1)) a
$func$ LANGUAGE sql IMMUTABLE;

将其设为IMMUTABLE 以允许性能优化和其他用途。

调用(使用_delim1_delim2 提供的默认值):

SELECT * FROM split_string('3.584731 60.739211,3.590472 60.738030');

或者:

SELECT * FROM split_string('3.584731 60.739211,3.590472 60.738030', ',', ' ');

最快

要获得最佳性能,请将translate()unnest(string_to_array(...)) 结合使用:

SELECT unnest(
          string_to_array(
             translate('3.584731 60.739211,3.590472 60.738030', ' ', ',')
           , ','
          )
       )::float8

【讨论】:

  • 该死,如果我不是学生,我会为此付钱给你!非常感谢!
  • 你最后指定的方法很聪明,+1
【解决方案2】:

不需要特殊功能,使用built-in regexp_split_to_table

SELECT *
  FROM regexp_split_to_table(
        '3.584731 60.739211,3.590472 60.738030,3.592740 60.736220',
        '[, ]') s;

编辑: 如果有内置函数,我不明白你为什么要坚持使用 PL/pgSQL 函数。

不管怎样,考虑这个例子:

WITH s AS
(
    SELECT ' ,'::text sep,
           '3.584731 60.739211,3.590472 60.738030,3.592740 60.736220'::text str
 )
SELECT sep, left(sep,1), right(sep,-1),
       str,
       translate(str, right(sep,-1), left(sep,1))
  FROM s;

这意味着,您可以:

  1. 在调用函数之前进行类似的转换或
  2. 将此代码集成到内部,但这意味着您需要引入至少一个额外的变量,除非您愿意在整个代码中将所有$1 替换为translate($1, right($2,-1), left($2,1))。显然,普通的$2 应该改为left($2,1)

【讨论】:

  • 我编辑了这个问题。我知道这种方式,但我需要 pl/pgSQl 函数:(
  • 在您的函数中使用 regexp_split_to_table() 并删除所有过时的代码。返回查询.....
【解决方案3】:

如果我能很好地理解你的问题,你可以这样做:

-- store context to temp table
CREATE TEMP TABLE foo AS SELECT v::double precision FROM split_string('...') g(v);

-- store context to ARRAY
SELECT ARRAY(SELECT v::double precision FROM split_string('....') g(v))

【讨论】:

    猜你喜欢
    • 2018-01-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-02-27
    相关资源
    最近更新 更多