【发布时间】:2016-10-27 02:56:36
【问题描述】:
我对数据类型和 UTF-8 编码感到非常困惑。引擎盖下到底发生了什么?我正在阅读 Python 3 中没有分隔符的凌乱 JSON 数据(数据不时有日文/中文字符)。
我正在读取数据:
url = "http://localhost:8001"
data = urllib.request.urlopen(url).read()
type(data)
它现在返回 bytes
那我要一个字一个字地读
for letter in data:
type(letter)
它现在返回我那个字母是一个整数。为什么它是一个字节,现在它是一个整数? 附言我知道我得到的整数代表字符的十进制表示。但是这种来回跳跃让我很困惑。
附:我也找不到 for-loop 的官方文档。有吗?
谢谢。
【问题讨论】:
-
“为什么它是一个字节,而现在它是一个整数?” 这里的“它”是什么?
letter?但是letter从来都不是一个字节。data?但data绝不是整数。这似乎等同于问题“为什么x = [1,2,3]; print(type(x)); print(type(x[0]))打印'list' 然后'int'?
标签: python string python-3.x utf-8