【问题标题】:What is the Unicode normalization form for an AWS S3 Buckets什么是 AWS S3 存储桶的 Unicode 规范化形式
【发布时间】:2016-12-26 12:19:57
【问题描述】:

在 AWS s3 存储桶上使用 UTF-8 格式的文件名时,我发现一些引用的文件名(在指向 s3 存储桶上文件的链接中)可能与相同的文件名不同被我的 python 应用程序的代码引用(我正在使用 boto 库)。我发现它们因normalization forms of unicode 的不同而不同,使用unicodedata.normalize 后问题就消失了。

但是,我还没有找到任何有关 AWS 使用的规范化形式的信息(NFCNFKCNFDNFKD),所以我将非常感谢任何提供该信息的来源的建议信息,谢谢。

【问题讨论】:

  • S3 完全标准化对象键似乎很奇怪。你能提供一个示例代码点序列以及它转换成的序列吗?

标签: python unicode amazon-s3


【解决方案1】:

看起来 S3 本身没有应用任何规范化。如果我从 Mac 上传(使用 S3 Web 控制台)一个带有 unicode 名称的文件(例如 Ärende.txt)到 S3,然后再从 Windows 上传,我将在 S3 中得到两个文件。它们在 S3 控制台中看起来相同,但在 S3 中它们被认为是不同的,因为名称的编码不同。

您必须准确考虑它如何影响您的应用程序(用户)并进行相应调整。例如,如果您的用户可能在环境(Mac、Windows 和 Linux)之间切换并期望一致的跨平台行为,那么您似乎需要自己规范化名称。如果您的用户始终在一个平台上工作,那么您很可能不需要关心。

【讨论】:

    猜你喜欢
    • 2020-04-13
    • 1970-01-01
    • 2011-07-20
    • 2021-03-24
    • 2020-08-07
    • 1970-01-01
    • 2017-06-26
    • 2018-02-01
    • 1970-01-01
    相关资源
    最近更新 更多