【发布时间】:2019-10-25 10:20:25
【问题描述】:
我想自动从 pdf 下载文件(其中有链接)。 我已经编写了一个脚本,它可以找到所有这些链接并且效果很好,我面临的问题是文件名。 我想用它们的默认名称保存它们,这样就很容易理解每个文件是什么,而无需手动更改每个名称。 问题是,根据这个站点https://www.webatic.com/url-convertor,每个名称都是使用 unicode (utf-8) 编码的,它可以很好地转换编码的字符串,但是 python 不允许我使用函数 decode 来解码它。
例如:这个字符串 %D7%97%D7%95%D7%9E%D7%A8%D7%99+%D7%9C%D7%99%D7%9E%D7%95%D7%93 应该解码后变成 חומרי לימוד。
【问题讨论】: