使用两个分隔符拆分字符串并转换类型答案

【问题标题】：Split string with two delimiters and convert type使用两个分隔符拆分字符串并转换类型
【发布时间】：2015-01-24 17:50:39
【问题描述】：

我有一个这样的 PL/pgSQL 函数（感谢使这成为可能的人）：

 CREATE OR REPLACE FUNCTION public.split_string(text, text)
    RETURNS SETOF text
    LANGUAGE plpgsql
    AS $function$
    DECLARE 
      pos int; 
      delim_length int := length($2);
    BEGIN
      WHILE $1 <> ''
      LOOP
        pos := strpos($1,$2);
        IF pos > 0 THEN
          RETURN NEXT substring($1 FROM 1 FOR pos - 1);
          $1 := substring($1 FROM pos + delim_length);
        ELSE
          RETURN NEXT $1;
          EXIT;
        END IF; 
      END LOOP;
      RETURN;
    END;
    $function$

它用分隔符分割字符串。像这样：

select * from split_string('3.584731 60.739211,3.590472 60.738030,3.592740 60.736220', ' ');

"3.584731"
"60.739211,3.590472"
"60.738030,3.592740"
"60.736220"

如何将结果保存在 temp_array 或 temp_table 中。所以我可以在 temp_x 中得到结果并再次拆分这些点。喜欢：

"3.584731"
"60.739211"
"3.590472"
"60.738030"
"3.592740"
"60.736220"

并将值返回为double precision。而这一切都应该在函数中完成。

【问题讨论】：

你的 Postgres 版本对于这样的问题是必不可少的。另外，请提供您认为需要 plpgsql 的理由。

标签： postgresql plpgsql set-returning-functions

【解决方案1】：

如果需要中间步骤：

SELECT unnest(string_to_array(a, ' '))::float8
       -- or do something else with the derived table
FROM   unnest(string_to_array('3.584731 60.739211,3.590472 60.738030', ',')) a;

这比regexp_split_to_table() 更详细，但可能仍然更快，因为正则表达式通常更昂贵。（使用EXPLAIN ANALYZE 进行测试。）

我首先在',' 拆分，然后在' ' 拆分-您描述的相反顺序似乎更合适。

如果需要，您可以将其包装到 PL/pgSQL 函数中：

CREATE OR REPLACE FUNCTION public.split_string(_str text
                                             , _delim1 text = ','
                                             , _delim2 text = ' ')
  RETURNS SETOF float8 AS
$func$
BEGIN
   RETURN QUERY
   SELECT unnest(string_to_array(a, _delim2))::float8
          -- or do something else with the derived table from step 1
   FROM   unnest(string_to_array(_str, _delim1)) a;
END
$func$ LANGUAGE plpgsql IMMUTABLE;

或者只是一个 SQL 函数：

CREATE OR REPLACE FUNCTION public.split_string(_str text
                                             , _delim1 text = ','
                                             , _delim2 text = ' ')
  RETURNS SETOF float8 AS
$func$
   SELECT unnest(string_to_array(a, _delim2))::float8
   FROM   unnest(string_to_array(_str, _delim1)) a
$func$ LANGUAGE sql IMMUTABLE;

将其设为IMMUTABLE 以允许性能优化和其他用途。

调用（使用_delim1 和_delim2 提供的默认值）：

SELECT * FROM split_string('3.584731 60.739211,3.590472 60.738030');

或者：

SELECT * FROM split_string('3.584731 60.739211,3.590472 60.738030', ',', ' ');

最快

要获得最佳性能，请将translate() 与unnest(string_to_array(...)) 结合使用：

SELECT unnest(
          string_to_array(
             translate('3.584731 60.739211,3.590472 60.738030', ' ', ',')
           , ','
          )
       )::float8

【讨论】：

该死，如果我不是学生，我会为此付钱给你！非常感谢！
你最后指定的方法很聪明，+1

【解决方案2】：

不需要特殊功能，使用built-in regexp_split_to_table：

SELECT *
  FROM regexp_split_to_table(
        '3.584731 60.739211,3.590472 60.738030,3.592740 60.736220',
        '[, ]') s;

编辑： 如果有内置函数，我不明白你为什么要坚持使用 PL/pgSQL 函数。

不管怎样，考虑这个例子：

WITH s AS
(
    SELECT ' ,'::text sep,
           '3.584731 60.739211,3.590472 60.738030,3.592740 60.736220'::text str
 )
SELECT sep, left(sep,1), right(sep,-1),
       str,
       translate(str, right(sep,-1), left(sep,1))
  FROM s;

这意味着，您可以：

在调用函数之前进行类似的转换或
将此代码集成到内部，但这意味着您需要引入至少一个额外的变量，除非您愿意在整个代码中将所有$1 替换为translate($1, right($2,-1), left($2,1))。显然，普通的$2 应该改为left($2,1)。

【讨论】：

我编辑了这个问题。我知道这种方式，但我需要 pl/pgSQl 函数:(
在您的函数中使用 regexp_split_to_table() 并删除所有过时的代码。返回查询.....

【解决方案3】：

如果我能很好地理解你的问题，你可以这样做：

-- store context to temp table
CREATE TEMP TABLE foo AS SELECT v::double precision FROM split_string('...') g(v);

-- store context to ARRAY
SELECT ARRAY(SELECT v::double precision FROM split_string('....') g(v))

【讨论】：