【发布时间】:2013-12-31 19:41:21
【问题描述】:
我正在开发一个 R 包,它要求我报告每个返回值的百分位等级。但是,我拥有的分布是巨大的(约 1000 万个值)。
我目前的做法是生成一个ecdf 函数,将该函数保存到文件中,并在需要时将其读取到包中。这是有问题的,因为我保存的文件最终很大(~120mb)并且需要很长时间才能重新加载:
f = ecdf(rnorm(10000000))
save(f, file='tmp.Rsav')
有没有办法通过近似 R 中的百分等级来提高效率?
谢谢
【问题讨论】:
标签: r distribution percentage rank cdf