【问题标题】:How do I convert unicode characters (ASCII 10) to text in Python如何在 Python 中将 unicode 字符(ASCII 10)转换为文本
【发布时间】:2023-09-20 20:42:01
【问题描述】:

我在 Python 中使用 http.client.HTTPConnection 请求结果。结果是这样的:

\u000aFull command = \/opt\/ericsson\/amos\/moshell\/mobatch \u000a Hello

我想将其转换为标准文本以供下一次解析操作

response = connection.getresponse()
html_response = response.read().decode('ascii')

我在这里期待的结果是

Full command = /opt/ericsson/amos/moshell/mobatch
Hello

但它甚至没有转换,我直接得到同样的东西。 我已经尝试过正则表达式替换,但我不想在 ASCII 10 列表中的所有字符中挣扎。

【问题讨论】:

  • .decode("unicode-escape") 工作吗?
  • 如果你print(html_response)你得到你需要的东西吗?
  • .decode("unicode-escape") @film 或其仅工作“\”字符。它对 \u000a 没有帮助。
  • @MarkRansom 还是那样
  • 查看*.com/questions/4020539/…上的第二个答案

标签: python unicode ascii webrequest unicode-escapes


【解决方案1】:

试试这个

  1. 使用 unicode_escape 解码 (docs)
  2. 删除多余的反斜杠

示例代码:

s = '\u000aFull command = \/opt\/ericsson\/amos\/moshell\/mobatch \u000a Hello'  
print s.decode('unicode_escape').replace('\\', '')

Full command = /opt/ericsson/amos/moshell/mobatch  
 Hello

【讨论】:

    最近更新 更多