【发布时间】:2020-10-20 01:48:56
【问题描述】:
zmap 函数的 scipy stats 模块有什么替代方法吗?我目前正在使用它来获取两个非常大的数组的 zmap 分数,这需要相当长的时间。
是否有任何库或替代品可以提高其性能?或者甚至是另一个获取 zmap 函数的作用?
您的想法和 cmets 将不胜感激!
下面是我的最小可重现代码:
from scipy import stats
import numpy as np
FeatureData = np.random.rand(483, 1)
goodData = np.random.rand(4640, 483)
FeatureNorm= stats.zmap(FeatureData, goodData)
下面是 scipy stats.zmap 的作用:
def zmap(scores, compare, axis=0, ddof=0):
scores, compare = map(np.asanyarray, [scores, compare])
mns = compare.mean(axis=axis, keepdims=True)
sstd = compare.std(axis=axis, ddof=ddof, keepdims=True)
return (scores - mns) / sstd
关于如何针对我的用例优化它的任何想法?我可以使用像 numba 或 JAX 这样的库来进一步提升它吗?
【问题讨论】:
-
你看过the source code吗?如果您添加一个最小的、可重现的问题示例,这里的用户将更容易为您提供具体的解决方案。
-
我看过源代码,但不太清楚如何优化它。我添加了一个最小的可重现代码示例。
标签: python performance scipy numba jax