【问题标题】:Decoding an encoded URL解码编码的 URL
【发布时间】:2019-10-25 10:20:25
【问题描述】:

我想自动从 pdf 下载文件(其中有链接)。 我已经编写了一个脚本,它可以找到所有这些链接并且效果很好,我面临的问题是文件名。 我想用它们的默认名称保存它们,这样就很容易理解每​​个文件是什么,而无需手动更改每个名称。 问题是,根据这个站点https://www.webatic.com/url-convertor,每个名称都是使用 unicode (utf-8) 编码的,它可以很好地转换编码的字符串,但是 python 不允许我使用函数 decode 来解码它。

例如:这个字符串 %D7%97%D7%95%D7%9E%D7%A8%D7%99+%D7%9C%D7%99%D7%9E%D7%95%D7%93 应该解码后变成 חומרי לימוד。

【问题讨论】:

    标签: python unicode decode


    【解决方案1】:

    Python 有一个 URL 解析器:

    >>> import urllib.parse
    >>> urllib.parse.unquote_plus('%D7%97%D7%95%D7%9E%D7%A8%D7%99+%D7%9C%D7%99%D7%9E%D7%95%D7%93')
    'חומרי לימוד'
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-08-05
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-11-09
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多