【发布时间】:2021-03-08 15:23:03
【问题描述】:
这个问题与this old question和this old question有关。
R 具有很好的包装函数anyNA,可以更快地评估any(is.na(x))。在 Rcpp 中工作时,可以通过以下方式给出类似的最小实现:
// CharacterVector example
#include <Rcpp.h>
using namespace Rcpp;
template<typename T, typename S>
bool any_na(S x){
T xx = as<T>(x);
for(auto i : xx){
if(T::is_na(i))
return true;
}
return false;
}
// [[Rcpp::export(rng = false)]]
LogicalVector any_na(SEXP x){
return any_na<CharacterVector>(x);
}
// [[Rcpp::export(rng = false)]]
SEXP overhead(SEXP x){
CharacterVector xx = as<CharacterVector>(x);
return wrap(xx);
}
/***R
library(microbenchmark)
vec <- sample(letters, 1e6, TRUE)
vec[1e6] <- NA_character_
any_na(vec)
# [1] TRUE
*/
但是将其与anyNA 的性能进行比较,我对下面的基准感到惊讶
library(microbenchmark)
microbenchmark(
Rcpp = any_na(vec),
R = anyNA(vec),
overhead = overhead(vec),
unit = "ms"
)
Unit: milliseconds
expr min lq mean median uq max neval cld
Rcpp 2.647901 2.8059500 3.243573 3.0435010 3.675051 5.899100 100 c
R 0.800300 0.8151005 0.952301 0.8577015 0.961201 3.467402 100 b
overhead 0.001300 0.0029010 0.011388 0.0122510 0.015751 0.048401 100 a
最后一行是从SEXP 到CharacterVector 的来回转换所产生的“开销”(结果可以忽略不计)。显而易见,Rcpp 版本比 R 版本慢大约 3.5 倍。我很好奇,所以我检查了 Rcpp 的 is_na 的源代码,并没有发现性能缓慢的明显原因,我继续检查 source for anyNA for R's own character vectors's 并使用 R 的 C API 思维重新实现该函数以加快速度
// Added after SEXP overhead(SEXP x){ --- }
inline bool anyNA2(SEXP x){
R_xlen_t n = Rf_length(x);
for(R_xlen_t i = 0; i < n; i++){
if(STRING_ELT(x, i) == NA_STRING)
return true;
}
return false;
}
// [[Rcpp::export(rng = false)]]
SEXP any_na2(SEXP x){
bool xx = anyNA2(x);
return wrap(xx);
}
// [[Rcpp::export(rng = false)]]
SEXP any_na3(SEXP x){
Function anyNA("anyNA");
return anyNA(x);
}
/***R
microbenchmark(
Rcpp = any_na(vec),
R = anyNA(vec),
R_C_api = any_na2(vec),
Rcpp_Function = any_na3(vec),
overhead = overhead(vec),
unit = "ms"
)
# Unit: milliseconds
# expr min lq mean median uq max neval cld
# Rcpp 2.654901 2.8650515 3.54936501 3.2392510 3.997901 8.074201 100 d
# R 0.803701 0.8303015 1.01017200 0.9400015 1.061751 2.019902 100 b
# R_C_api 2.336402 2.4536510 3.01576302 2.7220010 3.314951 6.905101 100 c
# Rcpp_Function 0.844001 0.8862510 1.09259990 0.9597505 1.120701 3.011801 100 b
# overhead 0.001500 0.0071005 0.01459391 0.0146510 0.017651 0.101401 100 a
*/
请注意,我还包含一个简单的包装器,调用 anyNA 到 Rcpp::Function。再一次,anyNA 的这个实现不仅比基本实现慢一点,而且很多慢。
所以问题变成了2折:
- 为什么 Rcpp 这么慢?
- 源自 1:如何“更改”以加快代码速度?
这些问题本身并不是很有趣,但如果这会影响 Rcpp 实现的多个部分,而这些部分总体上可能会获得显着的性能提升,那就很有趣了。
SessonInfo()
sessionInfo()
R version 4.0.3 (2020-10-10)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 10 x64 (build 19042)
Matrix products: default
locale:
[1] LC_COLLATE=English_Denmark.1252 LC_CTYPE=English_Denmark.1252 LC_MONETARY=English_Denmark.1252 LC_NUMERIC=C LC_TIME=English_Denmark.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] microbenchmark_1.4-7 cmdline.arguments_0.0.1 glue_1.4.2 R6_2.5.0 Rcpp_1.0.6
loaded via a namespace (and not attached):
[1] codetools_0.2-18 lattice_0.20-41 mvtnorm_1.1-1 zoo_1.8-8 MASS_7.3-53 grid_4.0.3 multcomp_1.4-15 Matrix_1.2-18 sandwich_3.0-0 splines_4.0.3
[11] TH.data_1.0-10 tools_4.0.3 survival_3.2-7 compiler_4.0.3
编辑(不仅仅是windows问题):
我想确保这不是“Windows 问题”,所以我在运行 linux 的 Docker 容器中检查并执行了该问题。结果如下图,非常相似
# Unit: milliseconds
# expr min lq mean median uq max neval
# Rcpp 2.3399 2.62155 4.093380 3.12495 3.92155 26.2088 100
# R 0.7635 0.84415 1.459659 1.10350 1.42145 12.1148 100
# R_C_api 2.3358 2.56500 3.833955 3.11075 3.65925 14.2267 100
# Rcpp_Function 0.8163 0.96595 1.574403 1.27335 1.56730 11.9240 100
# overhead 0.0009 0.00530 0.013330 0.01195 0.01660 0.0824 100
会话信息:
sessionInfo()
R version 4.0.2 (2020-06-22)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 20.04 LTS
Matrix products: default
BLAS/LAPACK: /usr/lib/x86_64-linux-gnu/openblas-openmp/libopenblasp-r0.3.8.so
locale:
[1] LC_CTYPE=en_US.UTF-8 LC_NUMERIC=C
[3] LC_TIME=en_US.UTF-8 LC_COLLATE=en_US.UTF-8
[5] LC_MONETARY=en_US.UTF-8 LC_MESSAGES=C
[7] LC_PAPER=en_US.UTF-8 LC_NAME=C
[9] LC_ADDRESS=C LC_TELEPHONE=C
[11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] microbenchmark_1.4-7 Rcpp_1.0.5
loaded via a namespace (and not attached):
[1] compiler_4.0.2 tools_4.0.2
【问题讨论】:
-
(完成:你为什么要使用
inline?当我们没有别的东西时它是一个非常有用的包(并且仍然可以正常工作)但是 Rcpp 属性使事情变得更加紧凑和可读。)跨度> -
我不完全确定我在哪里使用
inline@DirkEddelbuettel?我使用Rcpp::sourceCpp使代码在这里可重现,而实际上代码被包装在一个包中(评估时间没有区别) -
有道理。老实说,我没有考虑到这一点。为了读者,我会编辑。
-
另外,完全从臀部拍摄,你在你的第一个函数中的第一条语句强制一个转换(已经矢量化并在下面编译代码)R函数不会有.如果你把双腿绑在一起,在比赛中很难击败某人......
-
请@DirkEddelbuettel 按照我对您的评论和问题本身的回答中的链接进行操作。 (他们直接转到 R 源代码中的
doANY)。可以理解。我们都有有限的时间。do_any2类似于 R C 源中anyNA中STRSXP的第 2357 - 2360 行,由do_anyNA调用(do_anyNA由 R 中的anyNA调用)。代码的其余部分处理错误检查和其他输入类型(例如VECSXP)。所以我在 R-source 中简单地消除了do_anyNA和anyNA的“不必要”部分,并在any_na2中实现了它们。我在示例中找不到梨。