【发布时间】:2013-05-30 09:38:53
【问题描述】:
代码:
import urlparse
url1 = 'http://try.github.io//levels/1/challenges/1'
netloc1 = urlparse.urlparse(url1)[1] #try.github.io
url2 = 'https://github.com/explore'
netloc2 = urlparse.urlparse(url2)[1] #github.com
netloc2是我想要的,但是,我希望netloc1是github.io,如果使用正则表达式,如何处理。
【问题讨论】:
-
你有一个可行的 Pythonic 解决方案,并想编写一个正则表达式来做同样的事情 - 对吗?
-
是的,谢谢你的提示
-
问题是您需要一个 TLD 列表才能使其工作。例如,
foo.bar.com.br中的 netloc 是什么?反对foo.bar.com。如果没有有效的 TLD 列表,就无法让所有 TLD 都使用此功能。 -
从这个问题中并不清楚你在寻找什么。你能扩展“给定'this'我期待'that'”部分吗?