【问题标题】:Decode byte with UTF-8使用 UTF-8 解码字节
【发布时间】:2018-10-29 18:14:30
【问题描述】:

我目前正在查询一个 kdb 系统,它以字节为单位返回数据。特别是在一列中,我得到了一个看起来像这样的字节对象

b'US $ to UK \xa3 (TTF)'

如果我想解码它的字符串版本,我可以执行以下操作:

result = 'US $ to UK \xa3 (TTF)'.encode().decode()

但我想不出解码字节对象的方法,有什么建议吗?

我试过了

b'US $ to UK \xa3 (TTF)'.decode() 

但这给出了一个例外,因为 \xa3 尚未编码,有没有办法将此字节对象转换为字符串文字而无需解码?

【问题讨论】:

    标签: python utf-8 utf


    【解决方案1】:

    该字符串的编码似乎是 ISO-8859-1(a.k.a. Latin-1),而不是 UTF-8。正确解码字符串后,您将能够使用它或将其编码为其他编码,例如 UTF-8。

    raw = b'US $ to UK \xa3 (TTF)'
    text = raw.decode('ISO-8859-1')
    

    【讨论】:

      猜你喜欢
      • 2018-04-22
      • 1970-01-01
      • 2019-02-24
      • 2020-07-17
      • 2019-11-10
      • 1970-01-01
      • 2015-08-24
      • 2017-09-27
      • 1970-01-01
      相关资源
      最近更新 更多