【问题标题】:String from Base64 decoded value corrupt (Java),来自 Base64 解码值损坏的字符串(Java),
【发布时间】:2015-10-28 01:11:13
【问题描述】:

我将base64 encoded stringClassic ASP 页面发送到JSP 页面。在编码之前,该字符串是 RC4 加密的。

现在,我观察到,在ASP 页面中,使用base64 对字符串进行编码和解码工作正常。但是,JSP 页面上的base64 decoded string 不正确。我还尝试在 Eclipse 中解码字符串并得到相同的结果。它似乎与字符编码类型有关,但我正在努力确定究竟是什么问题。

  • base64 编码字符串:yOBIC4FY
  • base64 解码字符串(来自 ASP 页面):ÈàHsX(正确)
  • base64 解码字符串(来自 JSP 页面和 Eclipse):ÈàHs?X(不正确)

Java/JSP 代码:

import org.apache.commons.codec.binary.Base64;

String base64String = "yOBIc4FY";

byte[] decodedBase64Byte = Base64.decodeBase64(base64String);
        
// ÈàHs?X
decodedBase64String = new String(decodedBase64Byte, "ISO-8859-1");

// ÈàHs?X
decodedBase64String = new String(decodedBase64Byte, "windows-1252");

// ??Hs?X
decodedBase64String = new String(decodedBase64Byte, "utf-8");

重申一下,正确值应该是ÈàHsX。我不明白有什么问题。任何帮助将不胜感激。

谢谢。

更新

让我进一步阐述这一点。

Classic ASP 中的 RC4 加密算法已被广泛使用,因此我不会在此处浪费资源。但是,我将在下面显示我用于“经典 ASP”的base64 encoder/decoder

对于 RC4,我使用的明文值是 foobar。我使用的关键是test。从表面上看,解码 base64 字符串应该返回密码。并且解密密码应该返回明文值。

' Functions to provide encoding/decoding of strings with Base64.
' 
' Encoding: myEncodedString = base64_encode( inputString )
' Decoding: myDecodedString = base64_decode( encodedInputString )
'
' Programmed by Markus Hartsmar for ShameDesigns in 2002. 
' Email me at: mark@shamedesigns.com
' Visit our website at: http://www.shamedesigns.com/
'

    Dim Base64Chars
    Base64Chars =   "ABCDEFGHIJKLMNOPQRSTUVWXYZ" & _
            "abcdefghijklmnopqrstuvwxyz" & _
            "0123456789" & _
            "+/"


    ' Functions for encoding string to Base64
    Public Function base64_encode( byVal strIn )
        Dim c1, c2, c3, w1, w2, w3, w4, n, strOut
        For n = 1 To Len( strIn ) Step 3
            c1 = Asc( Mid( strIn, n, 1 ) )
            c2 = Asc( Mid( strIn, n + 1, 1 ) + Chr(0) )
            c3 = Asc( Mid( strIn, n + 2, 1 ) + Chr(0) )
            w1 = Int( c1 / 4 ) : w2 = ( c1 And 3 ) * 16 + Int( c2 / 16 )
            If Len( strIn ) >= n + 1 Then 
                w3 = ( c2 And 15 ) * 4 + Int( c3 / 64 ) 
            Else 
                w3 = -1
            End If
            If Len( strIn ) >= n + 2 Then 
                w4 = c3 And 63 
            Else 
                w4 = -1
            End If
            strOut = strOut + mimeencode( w1 ) + mimeencode( w2 ) + _
                      mimeencode( w3 ) + mimeencode( w4 )
        Next
        base64_encode = strOut
    End Function

    Private Function mimeencode( byVal intIn )
        If intIn >= 0 Then 
            mimeencode = Mid( Base64Chars, intIn + 1, 1 ) 
        Else 
            mimeencode = ""
        End If
    End Function    


    ' Function to decode string from Base64
    Public Function base64_decode( byVal strIn )
        Dim w1, w2, w3, w4, n, strOut
        For n = 1 To Len( strIn ) Step 4
            w1 = mimedecode( Mid( strIn, n, 1 ) )
            w2 = mimedecode( Mid( strIn, n + 1, 1 ) )
            w3 = mimedecode( Mid( strIn, n + 2, 1 ) )
            w4 = mimedecode( Mid( strIn, n + 3, 1 ) )
            If w2 >= 0 Then _
                strOut = strOut + _
                    Chr( ( ( w1 * 4 + Int( w2 / 16 ) ) And 255 ) )
            If w3 >= 0 Then _
                strOut = strOut + _
                    Chr( ( ( w2 * 16 + Int( w3 / 4 ) ) And 255 ) )
            If w4 >= 0 Then _
                strOut = strOut + _
                    Chr( ( ( w3 * 64 + w4 ) And 255 ) )
        Next
        base64_decode = strOut
    End Function

    Private Function mimedecode( byVal strIn )
        If Len( strIn ) = 0 Then 
            mimedecode = -1 : Exit Function
        Else
            mimedecode = InStr( Base64Chars, strIn ) - 1
        End If
    End Function

在 ASP 中,明文值是从密码中正确实现的:

纯文本:foobar

密文:ÈàHsX

base64 字符串:yOBIC4FY

解码的base64字符串:ÈàHsX

解密文本:foobar

但是,将密码作为 base64 字符串传递给 JSP/Java,JSP/Java 如下所示:

纯文本:foobar(来自 ASP)

密文:ÈàHsX(来自 ASP)

base64 字符串:yOBIC4FY

解码 base64 字符串:ÈàHs?X

解密文本:foobßr

所以,这里没有加起来。事实上,对于 Java,对解密的方式进行一项更改会返回正确的解密文本 foobar。 Java代码中的RC4解密采用int[]类型形式的密码。

public int[] decrypt(int[] ciphertext, byte[] key) throws Exception {
    return encrypt(ciphertext, key);
}

换句话说,我必须将密码从String 类型转换为int[] 类型。我使用下面的函数来做到这一点:

public static int[] convertToIntArray(byte[] input)
{
    int[] ret = new int[input.length];
    for (int i = 0; i < input.length; i++)
    {
        ret[i] = input[i] & 0xff; // Range 0 to 255
    }
    return ret;
}

我有两个选择。我可以将base64字符串解码为byte[]类型并解密,这将返回foobar

String base64String = "yOBIc4FY";

byte[] decodedBase64Byte = Base64.decodeBase64(base64String);

int[] cipheredText =  convertToIntArray(decodedBase64Byte);

或者,我可以将 base64 字符串解码为byte[] 类型,然后将其转换为String 类型,然后再次将byte[] 类型转换为decrpyt,这将返回foobßr

String base64String = "yOBIc4FY";

byte[] decodedBase64Byte = Base64.decodeBase64(base64String);

// ÈàHs?X
String decodedBase64String = new String(decodedBase64Byte, "ISO-8859-1");

int[] cipheredText =  convertToIntArray(decodedBase64String.getBytes());

我的猜测是原始字节序列是正确的,因为 RC4 解密函数成功返回 foobar。但是,当我将字节序列转换为某个字符编码集的字符串时,它会更改值,最终解密后的值为foobßr

那么为什么 ASP 和 JSP/Java 报告的密码值略有不同呢? ASP 可以毫无问题地将 base64 字符串或密码解码回其明文值。我不知道是 ASP、JSP 还是两者都有问题。

【问题讨论】:

  • 您使用的是哪个网络服务器?雄猫?
  • 是的,用于 JSP 的 Tomcat。我也在 E​​clipse (JDK/JRE 1.6-1.8) 中本地测试过,同样的问题。

标签: java jsp asp-classic character-encoding base64


【解决方案1】:

yOBIc4FY的正确解码为6字节,具体为:

c8 e0 48 73 81 58

ÈàHsX 值可能只是将字符 0x81 忽略为不可打印。

证明:

y      O      B      I      c      4      F      Y
110010 001110 000001 001000 011100 111000 000101 011000

11001000 11100000 01001000 01110011 10000001 01011000
c8       e0       48       73       81       58

要解决您的后续问题 - 您应该使用从 base64 解码器获得的字节数组。如果需要,将其转换为int[],但不要从中创建String,因为编码会搞砸:

static void printByteArray(byte[] bytes) {
    for (byte b : bytes) {
        System.out.print(Integer.toHexString(b & 0xff) + ", ");
    }
    System.out.println();
}

public static void main(String[] args) {

    byte[] cipherBytes = Base64.getDecoder().decode("yOBIc4FY");
    printByteArray(cipherBytes); // c8, e0, 48, 73, 81, 58 - correct

    cipherBytes = new String(cipherBytes).getBytes();
    printByteArray(cipherBytes); // c8, e0, 48, 73, 3f, 58 - wrong
    // your results may vary depending on your default charset,
    // these are for windows-1250
}

这里可以看到原来正确的字节0x81变成了问号?(字节0x3f),因为0x81不代表创建@时使用的字符集中的有效字符987654334@ 来自字节数组。

【讨论】:

  • 有趣。您是否有关于如何推断它是 6 个字节和那些特定的 6 个字节的参考?我不完全确定这是正确的。我将进一步扩展问题以进行详细说明。非常感谢。
  • @user3621633 我用过freeformatter.com/base64-encoder.html - 您必须将解码后的值下载为文件并在十六进制编辑器中查看。同样 8 个字符 * 每个字符 6 位,base64 = 48 位编码,即 6 个字节(编码字符串中没有填充)。它也同意java.util.Base64 的解码方式。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-10-19
  • 1970-01-01
  • 1970-01-01
  • 2013-04-14
相关资源
最近更新 更多