【问题标题】:How to get the full url from a link如何从链接中获取完整的 url
【发布时间】:2016-02-20 16:39:28
【问题描述】:

说我去http://www.example.com/dir1/dir2/index.html有以下链接:

<a href="/about/">Link</a> <a href="/about">Link</a> <a href="/page.html/">Link</a> <a href="/page.html">Link</a>

我的问题是我不知道什么时候应该将哪些部分连接在一起,因为有些有斜杠,有些没有,我必须考虑到

http://www.example.com/dir1/dir2/index.html/about/

应该是

http://www.example.com/dir1/dir2/about/.

另外,我怎么知道/about 是目录而不是文件? 我将python3.5urllib.request 模块一起使用。

【问题讨论】:

  • 休息没问题,但你将如何决定dir1 在网址中位于dir2 之前?
  • 你的意思是我怎么知道去http://www.example.com/dir1/dir2或者按什么顺序放?
  • 为什么标记为 PHP?
  • 是的,在 dir2 之前决定 dir1comes 的基础是什么
  • 我不确定哪个是我的问题,因为订单很重要

标签: python html url


【解决方案1】:

你可以试试这个-

base_url = "http://www.example.com/dir1/dir2"
next = "/index.html"

然后,对于每个链接,提取href 属性并将其分配给next。每个链接的最终 URL 将是 base_url + next

【讨论】:

    猜你喜欢
    • 2023-03-29
    • 2012-01-07
    • 2016-09-07
    • 1970-01-01
    • 1970-01-01
    • 2021-12-25
    • 1970-01-01
    • 1970-01-01
    • 2022-01-05
    相关资源
    最近更新 更多