【发布时间】:2019-10-18 23:40:21
【问题描述】:
我需要使用正则表达式查找和替换长字符串中数字之间的任何空格。
我尝试使用诸如[0-9][\s][0-9] 之类的正则表达式,然后使用诸如.withColumn('free_text', regexp_replace('free_text', '[0-9][\s][0-9]', '')) 之类的regexp_replace。
但是,正则表达式匹配 1(space)4 我只想拥有 (space)
这是一个例子:
我有什么:
"Hello. I am Marie. My number is 768 990"
我想要的:
"Hello. I am Marie. My number is 768990"
谢谢,
【问题讨论】:
标签: regex pyspark regexp-replace