【发布时间】:2014-12-31 21:18:15
【问题描述】:
.astype(str) 是将一系列整数转换为一系列字符串的最有效方法吗?好像比较慢所以想问问。
【问题讨论】:
-
这使用了一个 nansafe 的内部例程。但是,空值检查非常便宜,所以让它采用快速路径(如果没有空值)是有意义的。问题在这里:github.com/pydata/pandas/issues/8732
标签: python string pandas series
.astype(str) 是将一系列整数转换为一系列字符串的最有效方法吗?好像比较慢所以想问问。
【问题讨论】:
标签: python string pandas series
我尝试了一些方法并找到了使用 numpy 的更快方法:
setup = """
import pandas, numpy
s = pandas.Series(numpy.random.randint(1,10,(100)))
"""
>>> timeit.timeit('s.astype(str)', setup=setup, number=10000)
3.33058500289917
>>> timeit.timeit('s.apply(str)', setup=setup, number=10000)
3.572000026702881
>>> timeit.timeit('s.apply(lambda x: str(x))', setup=setup, number=10000)
3.821247100830078
>>> timeit.timeit('s.values.astype(numpy.str)', setup=setup, number=10000)
0.08432412147521973
如您所见,使用 values 访问 numpy 数组并使用 astype 调用比下一个最快的方法快 40 倍以上。
【讨论】: