【发布时间】:2016-04-30 11:13:00
【问题描述】:
正如标题所暗示的,我想更好地了解使用应用于数据帧的自定义函数在速度方面的局限性。示例:
df.apply(custom_function)
文档及其相关内容 (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.apply.html) 在主题上有点偏离,只是将此功能称为根据所使用的功能使其变慢。由于我不知道这种矢量化是如何发生的 - 因此使我的函数的分析成为一个耗时的尝试和重复的事情,有人可以指出一些关于什么样的东西的经验法则: 1)不降低速度 2) 大大减慢了整个过程
更准确地说:如果我在函数中将东西保存在其他地方,我会受到严重损坏吗?
【问题讨论】:
标签: performance pandas vectorization apply