【发布时间】:2012-10-17 14:07:18
【问题描述】:
可能重复:
How to get string Objects instead Unicode ones from JSON in Python?
作为从 JSON API 调用解析的多级字典,我有很多输入。这些字符串都是 unicode,这意味着有很多 u'stuff like this'。我正在使用jq 来处理结果,需要将这些结果转换为 ASCII。
我知道我可以编写一个函数来像这样转换它:
def convert(input):
if isinstance(input, dict):
ret = {}
for stuff in input:
ret = convert(stuff)
elif isinstance(input, list):
ret = []
for i in range(len(input))
ret = convert(input[i])
elif isinstance(input, str):
ret = input.encode('ascii')
elif :
ret = input
return ret
这是否正确?不确定。不过这不是我想问你的。
我要问的是,这是解决问题的典型暴力解决方案。一定会有更好的办法。一种更pythonic的方式。我不是算法方面的专家,但这个看起来也不是特别快。
那么有没有更好的方法呢?或者如果没有,这个功能可以改进吗...?
回答后编辑
Mark Amery's answer 是正确的,但我想发布它的修改版本。他的函数适用于 Python 2.7+,而我使用的是 2.6,因此必须对其进行转换:
def convert(input):
if isinstance(input, dict):
return dict((convert(key), convert(value)) for key, value in input.iteritems())
elif isinstance(input, list):
return [convert(element) for element in input]
elif isinstance(input, unicode):
return input.encode('utf-8')
else:
return input
【问题讨论】:
-
如果您使用的是 Python 2,那么 unicode 不是
str的实例,而是unicode的实例。另外,在list和dict处理中,你做错了。 -
对于列表情况,您可能希望考虑处理任何可迭代的。在任何情况下,您都可以将 if 语句的分支替换为
ret = [convert(x) for x in input]。另外,检查你的字典大小写。ret将只包含字典中最后一个键转换为的任何内容。 -
@MichaelMior 以您所描述的方式处理任何可迭代对象的麻烦在于,并非所有可迭代对象都是类似列表的。例如,字典是可迭代的,但如果
input是字典,ret = [convert(x) for x in input]显然不是我们想要的。 -
@MarkAmery 当然。字典需要单独处理。
标签: python json algorithm unicode ascii