【发布时间】:2016-01-23 08:36:45
【问题描述】:
我想将英语翻译成 x 语言,为此 首先,将英文字符转换为等效的英文Unicode 然后将英文 Unicode 转换为 x Unicode 然后 x Unicode 到 x 个字符。所以,我想使用 c 语言或任何其他语言将一种语言 Unicode 转换为等效的其他语言 Unicode。
例如,我想将“Linux”(ex word)从英语转换为泰米尔语“லினக்ஸ்”
“Linux”的Unicode(ex word):004c 0069 006e 0075 0078
他们是否有可能将此英语 Unicode 转换为泰米尔语等效 Unicode?p>
【问题讨论】:
-
Unicode 是 Unicode。该标准多年来一直在发展,但所有语言共享相同的 Unicode,这就是它的全部意义所在。在过去,IBM(例如)对于不同的语言有不同的字符集。 Unicode 取代了这一切。
-
也许您正在考虑用多字节替换单字节字符(例如 ASCII 或 ISO Latin 1)?在 python 中看到
codecs模块,在 C 中看到 stackoverflow.com/questions/11576846/…。如果您使用 Python 3、Java 或 C#,则本机字符串无论如何都是 Unicode。 -
不清楚您真正想要做什么。你能举一些输入和输出的例子吗?
-
您似乎在寻找音译,但从一种文字的特征到另一种文字的特征之间没有单一的明确映射。我不熟悉泰米尔语,但即使使用相同脚本的语言也经常使用不兼容的约定。例如,英文单词 tape 已借入芬兰语为 teippi.
-
问题同时显示英语和泰米尔语 Linux 的事实是 Unicode 的含义。