【问题标题】:ASCII - (encoded) character set or character encodingASCII -(编码)字符集或字符编码
【发布时间】:2017-08-25 12:03:31
【问题描述】:

ASCII 是(编码的)字符集还是编码?一些消息来源说它是一个(7 位)编码,其他人说它是一个字符集。

什么是正确的?

【问题讨论】:

标签: encoding ascii


【解决方案1】:

这是一种编码,只支持特定的字符集。

曾几何时,当计算机或操作系统通常只支持一种编码时,出于足够明显的原因,将其支持的字符集称为字符集是明智的。 p>

从 1963 年开始,ASCII 是一种普遍支持的字符集,以及许多其他字符集,它们要么是它的变体,要么是它的 8 位扩展。

但是除了定义一组字符之外,它还分配了数值,所以它是一个编码字符集

并且由于它为每个字符提供了一个数字,它还提供了一种将这些字符存储在字节序列中的方法,只要字节大小为 7 位或更高,因此它还定义了一个 编码。

所以 ASCII 既用于指代它支持的字符集,也用于指代这些字符以数字方式存储的编码规则。

如今,大多数计算机都使用通用字符集。虽然有一些编码(UTF-8 和 UTF-16 是最普遍的)可以对整个 UCS 进行编码,但仍然有一些旧编码(如 ASCII)只能编码一小部分数字。

因此,ASCII 既可以指代编码也可以指代它支持的字符集,但在现代使用中(特别是在转义机制允许间接表示其他字符的情况下,例如作为字符实体引用)它主要被称为编码。相反,尽管 character set(或缩写 charset)有时仍用于指代编码。因此,按照通常的说法,这两者是同义词,尽管如此不幸(技术上不准确)。

【讨论】:

    【解决方案2】:

    您可以说 ASCII 是一个有两种编码的字符集:一种称为 ASCII 的 7 位编码和一种称为 ASCII 的 8 位编码。

    当通过不可靠的传输方式发送文本时,7 位比特有时与奇偶校验位方案配对。如今,错误检测和纠正在单独的层上进行处理,因此仅使用 8 位编码。

    随着概念的演变和融合,术语会随着时间而变化。 “字符”目前是一个非常模糊的术语。人们说字符时通常指的是字形。或者它们表示特定语言中的特定数据类型。

    “ASCII”是一个泛型品牌,会导致很多混淆。我上面描述的 ASCII 仅在非常特殊的上下文中使用。

    【讨论】:

      【解决方案3】:

      您的问题目前似乎无法正确回答,因为“字符集”定义不正确。

      https://en.wikipedia.org/wiki/Category:Character_sets 字符集类别包括有关特定字符编码的文章(请参阅文章了解准确定义,以及为什么不应使用“字符集”一词)。

      编辑:在我看来,ascii 只能被视为一种编码,或者更好的代码页。例如,参见微软代码页列表: 20127 us-ascii 65001 utf-8

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2014-03-05
        • 2015-06-23
        • 2014-03-18
        • 2016-02-12
        • 2018-04-17
        • 2014-01-28
        相关资源
        最近更新 更多