【问题标题】:What's the ASCII character code for '—'?'—' 的 ASCII 字符代码是什么?
【发布时间】:2012-05-08 14:44:40
【问题描述】:

我正在解码文本。我正在尝试在 ASCII 中查找 字符的字符代码,不要误认为 -。我试过不成功。有人知道如何转换吗?

【问题讨论】:

  • “解码这个字符”是什么意思?源文本使用什么编码,结果应该使用什么编码?
  • @raina77ow:我尝试在 Ascii 表中查找此字符的编号
  • 它不存在;因此,它的代码取决于使用什么编码。例如,在 Latin-1 文本中,mdash 用数字 151 表示。
  • 此字符不在 ASCII 范围内。
  • 我总是回来复制这个角色????

标签: unicode character-encoding ascii special-characters


【解决方案1】:

维基引述 (Em dash)

当实际的破折号不可用时(如在 ASCII 字符集中),使用双连字符(“--”)或三连字符减号(“---”)。在 Unicode 中,破折号是 U+2014(十进制 8212)。

Em dash 字符不是 ASCII 字符集的一部分。

【讨论】:

  • 所以当我这样做时:char check = s.charAt(0),当 s = 时,我会得到什么?你说如果我做int check = s.charAt(0),我会得到8212?
  • @AdamSh 这取决于您用于解码的内容。你没有发布任何代码,所以很难说。通常,当解码器遇到无法解码的内容时,它会用问号替换它。
  • 您应该抛出异常或开始使用更大的整数并返回 8212。
  • JavaScript 字符串是 Unicode(即它们不限于 ASCII),所以如果你执行 s.charAt(0),那么你会得到 em dash,它等于 s = '\u2014'
【解决方案2】:

被称为 Em Dash。它的字符代码是\u2014。它不是 ASCII 字符,因此您无法使用 ASCII 字符集对其进行解码,因为它不在 ASCII 字符表中。您可能想改用 UTF8。

【讨论】:

  • JavaScript 字符串支持 Unicode,但在内部使用 UCS-2,而不是 UTF-8。无论哪种方式,都无需知道表示它的编码,因为您可以按照您所说的\u2014 形式将其与 Unicode 代码点进行检查。
【解决方案3】:

窗户 对于带有数字小键盘的 Windows:

使用 Alt+0150(短划线)、Alt+0151(短划线)或Alt +8722(减号)使用数字键盘。

【讨论】:

    【解决方案4】:

    此字符在 ASCII 中不存在,而仅在 Unicode 中存在,通常采用 UTF-8 编码。

    在 UTF-8 中,字符由 2 或 3 字节序列(或有时更长)编码,其中两个或三个字节都不是有效的 ASCII 码,它们都在 ASCII 范围 0 之外到 127。

    有人怀疑上述内容仅部分回答了您的问题,但如果是这样,那么这可能是因为您的问题在不经意间只被问到了部分问题。有关更多详细信息,您可以使用更多细节来扩展您的问题。

    【讨论】:

      【解决方案5】:

      字符 不是 ASCII 集的一部分。

      但如果您希望将其转换为其他格式(如 U+hex),您可以使用this 在线工具。将您的角色放入第一个绿色框中,然后单击“转换”(框上方)

      您会在下面找到许多不同的代码,包括 U+hex

      U+2014


      如果链接断开或发表评论,请随时编辑此答案,以便我找到替代品。

      【讨论】:

        【解决方案6】:

        Alt + 0151 似乎可以解决问题 - 也许它不适用于所有键盘。

        【讨论】:

          【解决方案7】:

          alt-196 - 按住“Alt”键的同时,在数字小键盘上输入 196,然后松开“Alt”键

          【讨论】:

          • @MadDot,您的回答没有解决问题的上下文,这是关于字符的字符代码,而不是如何键入它。 (另外,你描述的字符是U+2500,而问题是关于U+2014。提示:在网络浏览器中,按F12并粘贴到控制台"—".codePointAt(0).toString(16)
          猜你喜欢
          • 2013-05-07
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2011-06-20
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          相关资源
          最近更新 更多