【发布时间】:2018-07-11 16:10:55
【问题描述】:
我正在尝试让 Rcpp 版本的 pmvnorm 至少与 R 中的 mvtnorm::pmvnorm 一样快。
我找到了https://github.com/zhanxw/libMvtnorm 并创建了一个带有相关源文件的 Rcpp 骨架包。我添加了以下使用 Armadillo 的函数(因为我在我编写的其他代码中使用它)。
//[[Rcpp::export]]
arma::vec triangl(const arma::mat& X){
arma::mat LL = arma::trimatl(X, -1); // omit the main diagonal
return LL.elem(arma::find(LL != 0));
}
//[[Rcpp::export]]
double pmvnorm_cpp(arma::vec& bound, arma::vec& lowtrivec){
double error;
int n = bound.n_elem;
double* boundptr = bound.memptr();
double* lowtrivecptr = lowtrivec.memptr();
double result = pmvnorm_P(n, boundptr, lowtrivecptr, &error);
return result;
}
从 R 构建包后,这是一个可重现的示例:
set.seed(1)
covar <- rWishart(1, 10, diag(5))[,,1]
sds <- diag(covar) ^-.5
corrmat <- diag(sds) %*% covar %*% diag(sds)
triang <- triangl(corrmat)
bounds <- c(0.5, 0.9, 1, 4, -1)
rbenchmark::benchmark(pmvnorm_cpp(bounds, triang),
mvtnorm::pmvnorm(upper=bounds, corr = corrmat),
replications=1000)
这表明 pmvnorm_cpp 比 mvtnorm::pmvnorm 慢得多。结果是不同的。
> pmvnorm_cpp(bounds, triang)
[1] 0.04300643
> mvtnorm::pmvnorm(upper=bounds, corr = corrmat)
[1] 0.04895361
这让我感到困惑,因为我认为基本的 fortran 代码是相同的。我的代码中有什么东西让一切都变慢了吗?还是我应该尝试直接移植 mvtnorm::pmvnorm 代码?我几乎没有使用fortran的经验。
建议赞赏,否则请原谅我的无能。
编辑:与替代品进行快速比较:
//[[Rcpp::export]]
NumericVector pmvnorm_cpp(NumericVector bound, NumericMatrix cormat){
Environment stats("package:mvtnorm");
Function f = stats["pmvnorm"];
NumericVector lower(bound.length(), R_NegInf);
NumericVector mean(bound.length());
NumericVector res = f(lower, bound, mean, cormat);
return res;
}
与 R 调用具有基本相同的性能(以下是 40 维 mvnormal):
> rbenchmark::benchmark(pmvnorm_cpp(bounds, corrmat),
+ mvtnorm::pmvnorm(upper=bounds, corr = corrmat),
+ replications=100)
test replications elapsed relative user.self sys.self
2 mvtnorm::pmvnorm(upper = bounds, corr = corrmat) 100 16.86 1.032 16.60 0.00
1 pmvnorm_cpp(bounds, corrmat) 100 16.34 1.000 16.26 0.01
所以在我看来,前面的代码中一定有什么事情发生了。要么是我如何处理犰狳的事情,要么是其他事情是如何联系起来的。我认为与最后一个实现相比应该有性能提升。
【问题讨论】:
-
基准测试结果如何?为什么你期望这会更快?您正在执行相同的代码,但使用 Rcpp 提供的额外抽象层。
-
基准取决于维度并且越来越差。它慢了 3-4 到 10 倍。我没想到它会更快,但大致相同。
-
哎呀,这些相对时间太糟糕了。绝对数字是多少?
-
我在笔记本电脑上运行了上面的例子,结果慢了 13 倍。我正在更新问题,并对该问题进行补充说明
标签: r rcpp armadillo normal-distribution cdf