【问题标题】:Convert binary to ASCII and vice versa将二进制转换为 ASCII,反之亦然
【发布时间】:2011-11-15 20:18:58
【问题描述】:

使用此代码获取字符串并将其转换为二进制:

bin(reduce(lambda x, y: 256*x+y, (ord(c) for c in 'hello'), 0))

这个输出:

0b110100001100101011011000110110001101111

如果我将它放入this site(在右侧网站上),我会收到hello 的消息。我想知道它使用什么方法。我知道我可以将二进制字符串拼接成 8 个,然后将其与 bin(ord(character)) 或其他方式的相应值匹配。真的在寻找更简单的东西。

【问题讨论】:

  • 你的问题是,“有没有比显而易见的方法更简洁的方法来逆向我的代码”?
  • 相关:b2a_bin extension in Cython 允许直接从字节字符串创建二进制字符串 ("01"),而无需创建中间 Python 整数。

标签: python binary ascii


【解决方案1】:

对于 Python 2 上 [ -~] 范围内的 ASCII 字符:

>>> import binascii
>>> bin(int(binascii.hexlify('hello'), 16))
'0b110100001100101011011000110110001101111'

反过来:

>>> n = int('0b110100001100101011011000110110001101111', 2)
>>> binascii.unhexlify('%x' % n)
'hello'

在 Python 3.2+ 中:

>>> bin(int.from_bytes('hello'.encode(), 'big'))
'0b110100001100101011011000110110001101111'

反过来:

>>> n = int('0b110100001100101011011000110110001101111', 2)
>>> n.to_bytes((n.bit_length() + 7) // 8, 'big').decode()
'hello'

支持 Python 3 中的所有 Unicode 字符:

def text_to_bits(text, encoding='utf-8', errors='surrogatepass'):
    bits = bin(int.from_bytes(text.encode(encoding, errors), 'big'))[2:]
    return bits.zfill(8 * ((len(bits) + 7) // 8))

def text_from_bits(bits, encoding='utf-8', errors='surrogatepass'):
    n = int(bits, 2)
    return n.to_bytes((n.bit_length() + 7) // 8, 'big').decode(encoding, errors) or '\0'

这里是单源 Python 2/3 兼容版本:

import binascii

def text_to_bits(text, encoding='utf-8', errors='surrogatepass'):
    bits = bin(int(binascii.hexlify(text.encode(encoding, errors)), 16))[2:]
    return bits.zfill(8 * ((len(bits) + 7) // 8))

def text_from_bits(bits, encoding='utf-8', errors='surrogatepass'):
    n = int(bits, 2)
    return int2bytes(n).decode(encoding, errors)

def int2bytes(i):
    hex_string = '%x' % i
    n = len(hex_string)
    return binascii.unhexlify(hex_string.zfill(n + (n & 1)))

示例

>>> text_to_bits('hello')
'0110100001100101011011000110110001101111'
>>> text_from_bits('110100001100101011011000110110001101111') == u'hello'
True

【讨论】:

  • @J.F.Sebastian 我用python当前版本尝试了这个方法,似乎它不起作用。
    TypeError: 'str' does not support the buffer interface
    你会更新你的答案吗
  • @hamza:它适用于 Python 2。在 Python 3 上,您应该首先将 str 转换为字节,例如 your_string.encode('ascii', 'strict')
  • @J.F.Sebasitian:谢谢,但是当我尝试反之时,unhexlify 函数返回错误消息:binascii.Error: Odd-length string。
  • @hamza:如果十六进制字符串的长度不均匀,则在其前面加上'0'。如果原始字符串中的第一个字符的 ascii 代码小于 16,例如 '\n''\t',就会发生这种情况。 ascii 字母 [ -~] 永远不会出现奇数长度。
【解决方案2】:

内置python

这里是简单字符串的纯python方法,留给后人。

def string2bits(s=''):
    return [bin(ord(x))[2:].zfill(8) for x in s]

def bits2string(b=None):
    return ''.join([chr(int(x, 2)) for x in b])

s = 'Hello, World!'
b = string2bits(s)
s2 = bits2string(b)

print 'String:'
print s

print '\nList of Bits:'
for x in b:
    print x

print '\nString:'
print s2

String:
Hello, World!

List of Bits:
01001000
01100101
01101100
01101100
01101111
00101100
00100000
01010111
01101111
01110010
01101100
01100100
00100001

String:
Hello, World!

【讨论】:

    【解决方案3】:

    我不确定你认为除了逐个字符之外你还能如何做到这一点——它本质上是一个逐个字符的操作。肯定有代码可以为您执行此操作,但没有比逐个字符执行此操作更“简单”的方法了。

    首先,您需要去掉0b 前缀,然后用左零填充字符串,使其长度可以被 8 整除,这样可以轻松地将位串分成字符:

    bitstring = bitstring[2:]
    bitstring = -len(bitstring) % 8 * '0' + bitstring
    

    然后将字符串分成八个二进制数字块,将它们转换为 ASCII 字符,然后将它们连接回字符串:

    string_blocks = (bitstring[i:i+8] for i in range(0, len(bitstring), 8))
    string = ''.join(chr(int(char, 2)) for char in string_blocks)
    

    如果你真的想把它当作一个数字,你仍然必须考虑这样一个事实,如果你想从左到右而不是从右到左,最左边的字符最多有七位数字.

    【讨论】:

      【解决方案4】:

      这是我解决你的任务的方法:

      str = "0b110100001100101011011000110110001101111"
      str = "0" + str[2:]
      message = ""
      while str != "":
          i = chr(int(str[:8], 2))
          message = message + i
          str = str[8:]
      print message
      

      【讨论】:

      • 为什么要在 str = "0" + str[2:] 处添加 '0' ? 0b 需要在这里删除,因为它是开始的。
      【解决方案5】:

      如果你不想导入任何文件,你可以使用这个:

      with open("Test1.txt", "r") as File1:
      St = (' '.join(format(ord(x), 'b') for x in File1.read()))
      StrList = St.split(" ")
      

      将文本文件转换为二进制文件。

      你可以用它把它转换回字符串:

      StrOrgList = StrOrgMsg.split(" ")
      
      
      for StrValue in StrOrgList:
          if(StrValue != ""):
              StrMsg += chr(int(str(StrValue),2))
      print(StrMsg)
      

      希望对您有所帮助,我已将其与一些自定义加密一起用于通过 TCP 发送。

      【讨论】:

        【解决方案6】:

        您是在寻找执行此操作的代码还是了解算法?

        Does this do what you need?特别是a2b_uub2a_uu?那里还有很多其他选项,以防那些不是您想要的。

        (注意:不是 Python 人,但这似乎是一个显而易见的答案)

        【讨论】:

        • 我一直在研究它,binascii 不适合我,主要是在寻找代码,如果我能看到它我能理解它。尽管感谢编辑:当使用 binascii a2b_uu 将 ascii 转换为二进制时,“h”是 \x00\x00\x00\x00\x00\x00\x00\x00 这不是我需要的,我需要 'hello' 和实际的 1 和 0不是看起来像 ascii 的 shellcode,它也只能按 char 工作 char
        • @Jaxidian 这对我的目的很有帮助。有人将一些数据存储在一个字符串中,我拥有它。我很确定这是填充的 64 二进制 b/c。我可以在上面成功使用b2a_base64,但结果确实令人困惑。如何从那里获取布尔值/整数 (0,1) 列表?
        【解决方案7】:

        将二进制转换为其等效字符。

        k=7
        dec=0
        new=[]
        item=[x for x in input("Enter 8bit binary number with , seprator").split(",")]
        for i in item:
            for j in i:
                if(j=="1"):
                    dec=2**k+dec
                    k=k-1
                else:
                    k=k-1
            new.append(dec)
            dec=0
            k=7
        print(new)
        for i in new:
            print(chr(i),end="")
        

        【讨论】:

          【解决方案8】:

          这是 J.F. Sebastian 的经过修饰的版本。感谢 J.F. Sebastian 的 sn-ps。

          import binascii, sys
          def goodbye():
              sys.exit("\n"+"*"*43+"\n\nGood Bye! Come use again!\n\n"+"*"*43+"")
          while __name__=='__main__':
              print "[A]scii to Binary, [B]inary to Ascii, or [E]xit:"
              var1=raw_input('>>> ')
              if var1=='a':
                  string=raw_input('String to convert:\n>>> ')
                  convert=bin(int(binascii.hexlify(string), 16))
                  i=2
                  truebin=[]
                  while i!=len(convert):
                      truebin.append(convert[i])
                      i=i+1
                  convert=''.join(truebin)
                  print '\n'+'*'*84+'\n\n'+convert+'\n\n'+'*'*84+'\n'
              if var1=='b':
                  binary=raw_input('Binary to convert:\n>>> ')
                  n = int(binary, 2)
                  done=binascii.unhexlify('%x' % n)
                  print '\n'+'*'*84+'\n\n'+done+'\n\n'+'*'*84+'\n'
              if var1=='e':
                  aus=raw_input('Are you sure? (y/n)\n>>> ')
                  if aus=='y':
                      goodbye()
          

          【讨论】:

            猜你喜欢
            • 2021-06-17
            • 1970-01-01
            • 1970-01-01
            • 2013-04-16
            • 2020-01-20
            • 1970-01-01
            • 1970-01-01
            • 2014-10-27
            相关资源
            最近更新 更多