解码编码的 URL答案

【问题标题】：Decoding an encoded URL解码编码的 URL
【发布时间】：2019-10-25 10:20:25
【问题描述】：

我想自动从 pdf 下载文件（其中有链接）。我已经编写了一个脚本，它可以找到所有这些链接并且效果很好，我面临的问题是文件名。我想用它们的默认名称保存它们，这样就很容易理解每个文件是什么，而无需手动更改每个名称。问题是，根据这个站点https://www.webatic.com/url-convertor，每个名称都是使用 unicode (utf-8) 编码的，它可以很好地转换编码的字符串，但是 python 不允许我使用函数 decode 来解码它。

例如：这个字符串 %D7%97%D7%95%D7%9E%D7%A8%D7%99+%D7%9C%D7%99%D7%9E%D7%95%D7%93 应该解码后变成 חומרי לימוד。

【问题讨论】：

标签： python unicode decode

【解决方案1】：

Python 有一个 URL 解析器：

>>> import urllib.parse
>>> urllib.parse.unquote_plus('%D7%97%D7%95%D7%9E%D7%A8%D7%99+%D7%9C%D7%99%D7%9E%D7%95%D7%93')
'חומרי לימוד'

【讨论】：