【发布时间】:2017-09-27 01:23:07
【问题描述】:
尝试将部分 Redshift 查询转换为 SparkSQL 或 SQL 和 UDF 的组合:
REGEXP_SUBSTR(referrer, '[^/]+\\.[^/:]+') as referrer_domain,
尝试使用regexp_extract(referrer, '[^/]+\\.[^/:]+', 1),但这似乎不是以相同的方式工作并且返回的结果不一致。
任何指针表示赞赏!
【问题讨论】:
-
你可以试试 regexp_replace(referrer, '[^/]+\\.[^/:]+', $1)
标签: apache-spark apache-spark-sql amazon-redshift pyspark-sql