【发布时间】:2022-01-07 06:32:04
【问题描述】:
我正在寻找一种正则表达式模式,它将删除文章(a、an、the)、特殊字符(;、:、% 等)并扩展缩写(inc.-> 'incorporation', & -> 'and ' 等)在雪花中。我可以在雪花中做到这一点,但它并不完全正确。下面是我的代码。问题是我想给出模式(例如,'a good book' 的输出应该是 'good book' 但字符串 'give a book' 应该保留为
'''
select REGEXP_REPLACE((
select REGEXP_REPLACE ((
select REGEXP_REPLACE ((
select REGEXP_REPLACE ((
select REGEXP_REPLACE ((
select REGEXP_REPLACE ((
select REGEXP_REPLACE ((
select REGEXP_REPLACE ((
select REGEXP_REPLACE ((
select REGEXP_REPLACE (
(select REGEXP_REPLACE(concat (' ', lower('a book of the great man'), ' '), '(^an )|(^the )|
(^a )'))
, '\\.|\\,|\\(|\\)|\\!|\\\\|/|£|\\$|%|\\^|\\*|-|\\+|=|_|{|}|\\[|\\]|#|~|;|:|''|`|@|<|>|\\?|
¬|\\|')
), ' & ', ' and ')
), ' ltd ', ' limited ')
), '', '')
'''
【问题讨论】:
-
所以,要求从语句的开头删除文章,这就是我从您发布的示例中理解的。对于特殊字符,它需要从任何出现或位置中删除?
-
是的,Srinath,没错
标签: regex snowflake-cloud-data-platform