【问题标题】:find network location from URL elegantly [duplicate]优雅地从 URL 中查找网络位置 [重复]
【发布时间】:2013-05-30 09:38:53
【问题描述】:

代码:

import urlparse
url1 = 'http://try.github.io//levels/1/challenges/1'
netloc1 = urlparse.urlparse(url1)[1]  #try.github.io

url2 = 'https://github.com/explore'
netloc2 = urlparse.urlparse(url2)[1]  #github.com

netloc2是我想要的,但是,我希望netloc1github.io,如果使用正则表达式,如何处理。

【问题讨论】:

  • 你有一个可行的 Pythonic 解决方案,并想编写一个正则表达式来做同样的事情 - 对吗?
  • 是的,谢谢你的提示
  • 问题是您需要一个 TLD 列表才能使其工作。例如,foo.bar.com.br 中的 netloc 是什么?反对foo.bar.com。如果没有有效的 TLD 列表,就无法让所有 TLD 都使用此功能。
  • 从这个问题中并不清楚你在寻找什么。你能扩展“给定'this'我期待'that'”部分吗?

标签: python regex urlparse


【解决方案1】:

说明

此正则表达式将验证 URL 是否包含 try.github.iogethub.com

^https?:[\/]{2}(try[.]github[.]io|github[.]com)

示例

我不知道 python,所以我提供了一个 php 示例来展示正则表达式的工作原理。

<?php
$sourcestring="your source string";
preg_match_all('/^https?:[\/]{2}(try[.]github[.]io|github[.]com)/im',$sourcestring,$matches);
echo "<pre>".print_r($matches,true);
?>

$matches Array:
(
    [0] => Array
        (
            [0] => http://try.github.io
            [1] => https://github.com
        )

    [1] => Array
        (
            [0] => try.github.io
            [1] => github.com
        )

)

免责声明

使用您的urlparse 解决方案可能会更容易,然后只需应用一些逻辑来测试[1] 返回的值。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2015-09-25
    • 2012-04-23
    • 2013-08-24
    • 2015-04-05
    • 2018-12-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多