【发布时间】:2016-12-26 12:19:57
【问题描述】:
在 AWS s3 存储桶上使用 UTF-8 格式的文件名时,我发现一些引用的文件名(在指向 s3 存储桶上文件的链接中)可能与相同的文件名不同被我的 python 应用程序的代码引用(我正在使用 boto 库)。我发现它们因normalization forms of unicode 的不同而不同,使用unicodedata.normalize 后问题就消失了。
但是,我还没有找到任何有关 AWS 使用的规范化形式的信息(NFC、NFKC、NFD 或 NFKD),所以我将非常感谢任何提供该信息的来源的建议信息,谢谢。
【问题讨论】:
-
S3 完全标准化对象键似乎很奇怪。你能提供一个示例代码点序列以及它转换成的序列吗?