【问题标题】:Java subtract value of char code in stringJava减去字符串中字符代码的值
【发布时间】:2015-01-11 16:44:44
【问题描述】:

我正在尝试将字符串转换为希伯来语编码(windows 1255),因此我需要从任何 char 1264 的值中减去并放入新字符串中。

这是我要转换的 javascript 代码:

strText = strText.replace(/[א-ת]/ig, function(a,b,c) {
        return escape(String.fromCharCode(a.charCodeAt(0)-1264));
    });

这是我用 Java 制作的,但我没有得到预期值:

String test = "שלום";
byte[] testBytes = test.getBytes();
String testResult = "";
for (int i = 0;i < testBytes.length;i++)
     {
        testResult += (char)((int)testBytes[i]-1264);
     }

我做错了什么?

【问题讨论】:

    标签: java character-encoding windows-1255


    【解决方案1】:

    由于您使用的是byte 数组,因此可以存储的最大数字为 255,最小为 0,因此它只能存储扩展的 ASCII 字符(afaik 它不包括希伯来字符)。您需要的是一个 char 数组(可以存储任何 unicode 字符)。

    所以,改变这个

    byte[] testBytes = test.getBytes();
    

    到这里

    char[] testBytes = test.toCharArray();
    

    【讨论】:

    • 感谢它的帮助,现在如何将其转换为 url 样式编码。我只需要转换 4 个字符,而不是完整的 url。
    【解决方案2】:

    调用String.getBytes(String)时需要传递编码。类似的东西

    public static void main(String[] args) {
        String test = "שלום";
        try {
            byte[] testBytes = test.getBytes("UTF-8");
            String testResult = new String(testBytes, "UTF-8");
            System.out.println(testResult);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
    

    输出是

    שלום
    

    【讨论】:

    • 但是我想把它转成windows-1255。减法把文字改成编码。
    • 没有。你永远不会这样减去来改变编码。您可以将不同的编码传递给new StringgetBytes()
    • 我能做什么?这是我发现的唯一改变它的方法。你知道将ut​​f-8转换为支持android的windows-1255的其他方法吗?谢谢。
    猜你喜欢
    • 2018-10-05
    • 1970-01-01
    • 1970-01-01
    • 2012-06-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-10-05
    相关资源
    最近更新 更多