dicts 更快,但只有一点点:
import timeit
setup = """
x = range(10000)
s = set(range(5000))
d = dict.fromkeys(range(5000))
"""
print '# set', timeit.timeit('for i in x: z = i in s', setup, number=1000)
print '# dic', timeit.timeit('for i in x: z = i in d', setup, number=1000)
# set 1.18897795677
# dic 1.1489379406
尽管如此,除非性能是绝对关键的,否则为了可读性,您应该使用集合。
当然,正如您的问题所暗示的那样,我们谈论的是可散列类型。不可散列的类型(如容器)需要其他技术。
为了完整起见,以下是不同修改方法的基准:
import timeit
setup = """
x = range(10000)
s = set(range(5000))
d = dict.fromkeys(range(5000))
add_method = s.add
"""
print '# set-add ', timeit.timeit('for i in x: s.add(i)', setup, number=1000)
print '# set-closure ', timeit.timeit('for i in x: add_method(i)', setup, number=1000)
print '# dict [] ', timeit.timeit('for i in x: d[i]=None', setup, number=1000)
print '# d.setdefault', timeit.timeit('for i in x: d.setdefault(i)', setup, number=1000)
# set-add 1.96829080582
# set-closure 1.2261030674
# dict [] 0.982795000076
# d.setdefault 2.27355480194
dict[i] 是最快的,但这一次并不奇怪,因为不涉及函数调用。