【问题标题】:How to get a utf code from symbol in linux如何从linux中的符号获取utf代码
【发布时间】:2013-10-04 17:43:06
【问题描述】:

我在 linux 上的文本文件中遇到一个特殊符号。我实际上成功地将它粘贴在以下字母“a‏a”之间(我在 Geany 中的光标停止但没有显示任何字符)。

我想知道获取其 utf8 代码(形式为 U+0000)的最简单方法是什么。我正在使用 ubuntu 和 geany,我在包含它的文件上尝试了 hexdump,但我显然遗漏了一些东西。

【问题讨论】:

  • 不要混淆 Unicode 代码点和它们的 UTF-8 表示。例如,U+0410 是首都西里尔字母 A,但其 UTF-8 表示为 0xD0 0x90。
  • 谢谢,我想知道如何在 grep 正则表达式中使用 unicode 代码,结果我需要一个字节一个字节的 UTF-8 表示(因为我猜我的文件使用 utf-8)。无论如何,叮咬是:0xE2 0x80 0x8F

标签: shell utf-8 hexdump


【解决方案1】:

你可以用 vim 打开文件,将文本光标放在字符上,然后输入“ga”(不带引号),它会在状态行中显示十进制、十六进制和八进制的字符代码。

【讨论】:

  • 谢谢,是从右到左的,vim居然马上就显示出来了:aa.
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2010-09-28
  • 1970-01-01
  • 2011-05-18
  • 1970-01-01
  • 2012-01-24
  • 2012-02-01
相关资源
最近更新 更多