【发布时间】:2017-09-05 08:32:39
【问题描述】:
我正在将字符串从英语翻译成德语,但是已经翻译的德语单词正在重新翻译。
假设我已经翻译了“Beim Hinzuf\u00E4gen”这个词。我想将此与同一个词进行比较,但带有变音符号“Beim Hinzufügen”。这两个文件都被读取为 ISO-8859-1,但是当我比较它们被视为不同的单词时,该单词被再次翻译,这是我不想要的。即使我用 unicode 替换 Umlaut 并比较两者,它们仍然被视为不同。我确定这是因为当我通过“\u00E4”重放变音符号时,会添加一个额外的反斜杠。
任何人都知道我正在尝试做的首选方法。
【问题讨论】:
-
尚不清楚您在此处包含的 Unicode 转义是否在文件中,或者文件的读取方式。请提供minimal reproducible example,以便我们为您提供帮助。
-
将添加代码,干杯!
-
你不应该将
Beim Hinzuf\u00E4gen与Beim Hinzufägen进行比较吗?注意第二个字符串中的ä -
抱歉,回复晚了。尤金你绝对正确。我不仅映射了错误的 unicode,而且似乎我正在用 UTF-8 编写文件,这似乎得到了您指出的错误 Unicode。现在已经解决了我的问题,谢谢!