【发布时间】:2021-07-28 19:26:40
【问题描述】:
现在我正在研究维基百科。在许多文章中,我注意到一些 URL,例如,https://www.google.com/search?q=%26%E0%B8%89%E0%B8%B1%E0%B8%99,非常长。示例 URL 可以替换为更短更简洁的“https://www.google.com/search?q=%26ฉัน”(ฉัน 是泰语单词)。但是,当我使用 urllib.unquote 函数解码 URL 时,它甚至会解码 %26 并得到“https://www.google.com/search?q=&ฉัน”作为结果。您可能已经注意到,这个 URL 是无用的;它没有建立有效的链接。
因此,我想知道如何在有效的情况下获取解码链接。我认为只解码非 ascii 字符会得到有效的 URL。这是正确的吗?以及如何做到这一点?
谢谢:)
【问题讨论】:
标签: python python-2.7 urldecode