【发布时间】:2010-09-13 12:33:28
【问题描述】:
RFC 1738 指定 URL 的语法,并提及
网址仅与图形一起编写
的可打印字符 US-ASCII 编码字符集。这 八位字节 80-FF 十六进制不是
用于 US-ASCII 和八位字节 00-1F 和7F十六进制表示
控制字符;这些必须是 编码。
但是,它没有说明这些八位位组代表什么代码集。
RFC 2396 似乎试图改善这种情况,但是:
对于原始字符序列, 包含非 ASCII 字符,然而,情况更多 难的。用于传输八位字节序列的 Internet 协议 表示字符序列有望提供某种方式 识别使用的字符集,如果可能有多个 [RFC2277]。但是,目前《条例》中并没有规定 通用 URI 语法来完成此标识。单个 URI 方案可能需要单个字符集,定义默认字符集,或 提供一种方法来指示所使用的字符集。
预计 URI 中字符编码的系统处理将是 作为本规范的未来修改而开发的。
是否有任何明确的方式可以让客户端确定使用哪个字符集来解释编码的八位位组,或者服务器可以通过哪种方式确定客户端使用什么进行编码?
在我看来,大多数服务器都默认使用 UTF-8,但这似乎是一种事实上的选择,而不是指定的选择。
【问题讨论】:
标签: url