【问题标题】:Base64 Decode : Specific String Incorrect Padding (with correct padding)Base64 解码:特定字符串不正确的填充(使用正确的填充)
【发布时间】:2017-05-24 17:14:37
【问题描述】:

我正在尝试使用 Python 的 base64.b64decode(str) 方法对字符串进行 Base64 解码(转换为字节):

46oWrWpy2gTEGwNnN6Ayy

并且我确保它有 4 个 = 的倍数用于填充或出于挫败感:

46oWrWpy2gTEGwNnN6Ayy=

46oWrWpy2gTEGwNnN6Ayy==

46oWrWpy2gTEGwNnN6Ayy===

46oWrWpy2gTEGwNnN6Ayy============================================= ====

但我仍然在 Python v3.6.1 上得到“不正确的填充”。其他字符串都可以。

我展示了一位同事,他尝试使用 Python 2 并观察到相同的响应。

我注意到删除第一个“4”足以确保 Base64 解码正常。

我略读了Python's docs(注意casefold 不适用于Base64),还没有进一步研究RFC3548,但我想知道其他人之前是否遇到过类似的事情。任何人都有任何线索:)?这肯定不会是 Python 的 Base64 解码器中的错误吗?

【问题讨论】:

    标签: python base64 python-3.6


    【解决方案1】:

    解决了。

    Base64 文本的每个字符是原始 8 位中的 6 位。如果一个字符在原始字节的中间,那么你会丢失一些剩余的位。 Wikipedia 文章(以及许多在线答案)似乎使用填充作为可互换的“0”字节,但事实并非如此(在 Base64 字典中,它应该编码为 A)。

    对于缺失数据,填充不可互换。

    #!/usr/bin/env python3
    
    # We use hexlify for debugging.
    import binascii
    
    # We use the Base64 library.
    import base64
    
    # Base64 works on multiples of 4 characters..
    # ..Sometimes we get 3/2/1 characters and it might be midway through another.
    def relaxed_decode_base64(data):
    
     # If there is already padding we strim it as we calculate padding ourselves.
     if '=' in data:
      data = data[:data.index('=')]
    
     # We need to add padding, how many bytes are missing.
     missing_padding = len(data) % 4
    
     # We would be mid-way through a byte.
     if missing_padding == 1:
      data += 'A=='
     # Jut add on the correct length of padding.
     elif missing_padding == 2:
      data += '=='
     elif missing_padding == 3:
      data += '='
    
     # Actually perform the Base64 decode.
     return base64.b64decode(data)
    
    # Debugging
    print(str(relaxed_decode_base64('46oWrWpy2gTEGwNnN6Ayy')) + '\n')
    
    testString = ''
    
    for count in range(0, 1024):
     testString += '/'
     print(str(len(testString)) + ' - ' + testString)
     print(binascii.hexlify(relaxed_decode_base64(testString)))
     input()
    

    【讨论】:

      【解决方案2】:

      似乎是您的数据有问题,与 Python 无关:

      $ echo 46oWrWpy2gTEGwNnN6Ayy | base64 -d
      㪭jrÚÄg7 2base64: invalid input
      $ echo 46oWrWpy2gTEGwNnN6Ayy= | base64 -d
      㪭jrÚÄg7 2base64: invalid input
      $ echo 46oWrWpy2gTEGwNnN6Ayy== | base64 -d
      㪭jrÚÄg7 2base64: invalid input
      $ echo 46oWrWpy2gTEGwNnN6Ayy=== | base64 -d
      㪭jrÚÄg7 2base64: invalid input
      $ echo 46oWrWpy2gTEGwNnN6Ayy==== | base64 -d
      㪭jrÚÄg7 2base64: invalid input
      

      我设法以这种方式对其进行解码(删除了最后一个“y”):

      $ echo 46oWrWpy2gTEGwNnN6Ay | base64 -d
      㪭jrÚÄg7 2
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2017-04-05
        • 1970-01-01
        • 2019-05-19
        • 2018-11-21
        • 1970-01-01
        • 2019-01-17
        • 1970-01-01
        相关资源
        最近更新 更多