【问题标题】:Google Sheet Formula To Extract Domain From Different Format Site URLs谷歌表格公式从不同格式的站点 URL 中提取域
【发布时间】:2021-10-01 16:48:27
【问题描述】:

我有一个 Google 电子表格,其中有网址列表。我有从 URL 中提取域的公式。但问题是当一个 URL 在域中有多个名称时。例如

我已将链接附加到示例文档和我尝试过的两个公式。这两个公式在某些格式下完美地工作,而不是在其他一些情况下。如果有办法结合这两种或某种方式来理解 URL 格式并选择最佳公式来提取域会很好。我试过无法达到预期的输出。谷歌表格链接如下。

Sample google sheet

【问题讨论】:

    标签: google-sheets-formula


    【解决方案1】:

    你可以只用一个公式,REGEXEXTRACT

    首先,我们从 url 中提取主机名。为此,我们使用以下公式:

    =REGEXEXTRACT(A2:A,"(?:www\.)?([\w._\-]{6,})")

    现在,我们从主机名中提取域。你可以这样做:

    =REGEXEXTRACT(...hostname... ,"[\w_\-]+\.\w{0,4}\.?\w{0,4}$")

    现在我们将所有内容构建到一个数组公式中:

    =ARRAYFORMULA(if(A2:A<>"",REGEXEXTRACT(REGEXEXTRACT(A2:A,"(?:www\.)?([\w._\-]{6,})"),"[\w_\-]+\.\w{0,4}\.?\w{0,4}$"),))

    我不会假装是你任务的最佳解决方案 - 也许有人会告诉你一些更简单的事情。

    【讨论】:

    • 嗨,谢尔盖,非常感谢。它确实对我帮助很大。我只有一个问题。在某些情况下,它会提取根域以及“www”。请检查第 22 行。我试图理解为什么会这样,但无法理解。
    • 嗨@JaiMani,我已经更新了我的答案。我在主机名提取中添加了www. 异常
    • 嗨,谢尔盖,效果很好。非常感谢。 :-)
    猜你喜欢
    • 1970-01-01
    • 2021-05-03
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-01-14
    • 2021-12-03
    • 1970-01-01
    相关资源
    最近更新 更多