【问题标题】:How to convert unicode string to ascii string in java? [closed]如何在java中将unicode字符串转换为ascii字符串? [关闭]
【发布时间】:2021-07-14 17:07:30
【问题描述】:

目前,Brenda's 已转换为 Brenda?s,但我希望将其转换为 Brenda's。我看到规范器类能够从字母中删除重音符号,但我不需要它,我想将 /u2019 转换为撇号。我也希望这在将来适用于其他标点符号。

【问题讨论】:

  • 你用eclipse,只看控制台输出?
  • @FrédéricPerron 刚刚尝试了该解决方案,但它也无法正确转换 '。它现在转换为一个带有方框的问号,而不仅仅是一个问号。
  • 在什么情况下在哪里转换?
  • @BrandonHu 好吧,我认为您在这里尝试解决错误的问题。与其将某些字符转换为另一个字符(这将非常困难,正如 rzwitserloot 已经指出的那样),不如正确设置字符编码。如果你到处都使用 UTF-8,你根本不会遇到你描述的问题。

标签: java ascii


【解决方案1】:

java 中没有任何东西可以做到这一点,而且一般原理非常复杂;例如,将 ü 'asciification' 为 ASCII 取决于语言,即使您对语言环境有所了解,这也是完全没用的:

想象一个名叫Sjögren 的挪威人搬到德国并在某个地方注册了一个以德语为重点的网站,并且您正在建立该网站并希望将其联系起来。你会去:好吧,变成Sjoegren。除非那是错误的。

实际上,您想要的通常是不可能的。尽管如此,您仍然有一个“尽力而为”的想法,例如全部 ö 到 oe 和全部 /u2019 到 ' 但据我所知 没有可用的标准转换表,事实上他们将挪威的 ö 定义为 o 但在德国正如oe 强烈暗示这样的事情充其量只是一种猜测(更像是在黑暗中的狂野刺伤),这表明这样的事情可能根本不存在。

当然,你可以自己写。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-03-21
    • 2010-12-09
    • 1970-01-01
    • 2023-03-30
    • 2011-12-26
    相关资源
    最近更新 更多