【问题标题】:unicode recognization is it utf-8 utf-16 or any thing else?unicode 识别是 utf-8 utf-16 还是别的什么?
【发布时间】:2011-01-23 02:12:56
【问题描述】:

我正在使用 postgre 数据库,它具有 UTF-8 编码 在那个马拉地语单词 pimpri 的 unicode 中是这样的 \u092A\u093F\u0902\u092A\u0930\u0940 \u0935\u093E\u0918\u0947\u0930\u0947

当我在客户端时,我写了一个代码 字符串 tempString=Strings.toEscapedUnicode(strQueryString[1]); 它生成这样的unicode u00E0\u00A4\u00AA\u00E0\u00A4\u00BF\u00E0\u00A4\u00AA\u00E0\u00A4\u0082\u00E0\u00A4\u00B0\u00E0\u00A5\u0080

所以我匹配它有问题。

我有一个问题,如何识别甲酸盐是什么? u00E0\u00A4\u00AA\u00E0\u00A4\u00BF\u00E0\u00A4\u00AA\u00E0\u00A4\u0082\u00E0\u00A4\u00B0\u00E0\u00A5\u0080这个是utf8还是utf16还是utf32

还有如何使用java将utf8转换为utf16有什么方法吗???

【问题讨论】:

    标签: java unicode utf-8 character-encoding utf-16


    【解决方案1】:

    您数据库中的数据似乎是 UTF-16。

    但您的客户端代码似乎是 UTF-8。查看您的数据,第一个字符 (DEVANAGARI LETTER PA) 在 UTF-16 中是 \u092A,在 UTF-8 中是 0xE0 0xA4 0xAA

    在 Java 中,您可以使用 getBytes 重载之一将字符串转换为特定编码的字节序列。

    【讨论】:

      【解决方案2】:

      为什么你必须处理编码? PostgreSQL JDBC 驱动程序应该处理它,Java 在内部使用 UTF-16。因此,您可以简单地将ResultSet.getString() 得到的字符串与任何其他字符串进行比较,或者如果使用PreparedStatement.setString(),则将任何字符串作为参数传递。

      【讨论】:

        猜你喜欢
        • 2019-10-08
        • 2011-04-26
        • 1970-01-01
        • 2022-01-23
        • 1970-01-01
        • 1970-01-01
        • 2014-08-21
        • 2011-04-24
        • 1970-01-01
        相关资源
        最近更新 更多