【发布时间】:2021-01-07 16:31:10
【问题描述】:
我正在开展一个项目,其中包括将拉丁符号转换为相应的西里尔符号。我说的是俄罗斯许多国家之一使用的鞑靼语。我尝试在 UTF-8 中找到这些符号,但到目前为止失败了。我唯一需要的是鞑靼符号的 UTF 代码。其中有 6 个。 谢谢!!
【问题讨论】:
-
维基百科页面可能包含您要查找的所有符号,因此如果您将要查找的符号复制到您的问题中,我们可能会帮助您对其进行编码。 en.wikipedia.org/wiki/Tatar_alphabet(通常正确的问题是“给定符号的 Unicode 名称是什么?”从名称中可以找到代码点,而 UTF-8 只是代码点的特定编码。)
-
如果您将字符粘贴到fileformat.info,它通常会告诉您其名称和编码。
-
一个XY problem?为什么要关心 UTF-8 字节序列?如今,任何(纯文本)编辑器都可以处理 UTF-8 - 甚至是 Windows 记事本 :))
-
@JosefZ:用户知道 UTF-8。他只是问了块,它是重要的,例如。选择正确的字体,或检查支持。普通的编辑器可以做 UTF-8,但这并不意味着你知道如何输入经典的英文排版字符(需要知道代码点,问题就是这个)
标签: utf-8 linguistics