【问题标题】:Vectorize a loop where iterations are dependent on previous ones in R向量化循环,其中迭代依赖于 R 中的先前迭代
【发布时间】:2021-04-12 09:21:48
【问题描述】:

我有以下工作代码:

x <- c(10.7, 13.0, 11.4, 11.5, 12.5, 14.1, 14.8, 14.1, 12.6, 16.0, 11.7, 10.6,
       10.0, 11.4, 7.9, 9.5, 8.0, 11.8, 10.5, 11.2, 9.2, 10.1, 10.4, 10.5)

cusum <- function(x) {
  
  s <- NA
  mn <- mean(x)
  
  for (i in seq_along(x)) {
  if (i == 1)
    s[i] <- 0 + x[i] - mn
  else
    s[i] <- s[i - 1] + x[i] - mn
  }
  
  s
  
}

cusum(x)

我希望对我的代码进行矢量化以提高性能,但我不知道如何,因为:

  • 我不能在lapply 和其他人中使用“迭代依赖”(即s[i - 1] 来计算s[i])。
  • 我无法遍历Reduce 中的两个向量(即sx

如何在基础 R 中矢量化我的函数?我在一个限制性的环境中工作,我只能访问基础 R。

【问题讨论】:

    标签: r for-loop vectorization lapply reduce


    【解决方案1】:

    对于这个特定的迭代,您不需要循环:只需在 x - mean(x) 上使用 cumsum

    cumsum(x - mean(x))
     [1] -6.958333e-01  9.083333e-01  9.125000e-01  1.016667e+00  2.120833e+00  4.825000e+00  8.229167e+00  1.093333e+01  1.213750e+01
    [10]  1.674167e+01  1.704583e+01  1.625000e+01  1.485417e+01  1.485833e+01  1.136250e+01  9.466667e+00  6.070833e+00  6.475000e+00
    [19]  5.579167e+00  5.383333e+00  3.187500e+00  1.891667e+00  8.958333e-01 -1.598721e-14
    

    【讨论】:

    • 非常感谢!我非常关注lapply/Reduce 和其他人。我完全错过了cumsum!
    【解决方案2】:

    @Cettt 的回答是最直接的,如果需要,请坚持下去。但是,如果您的意思是您不知道如何对任意函数进行矢量化,那么...

    当您的计算依赖于一个值和前一个值时,这是一回事,并且可以进行矢量化。但是,看起来您的计算似乎依赖于先前的计算,在这种情况下,它完全是另一回事。您的功能似乎是后者,因此尝试一下:

    func <- function(x) {
      mn <- mean(x)
      Reduce(function(a, b) {
        a + b - mn
      }, x, init = 0, accumulate = TRUE)[-1]
    }
    
    func(x)
    #  [1] -6.96e-01  9.08e-01  9.12e-01  1.02e+00  2.12e+00  4.82e+00  8.23e+00
    #  [8]  1.09e+01  1.21e+01  1.67e+01  1.70e+01  1.62e+01  1.49e+01  1.49e+01
    # [15]  1.14e+01  9.47e+00  6.07e+00  6.47e+00  5.58e+00  5.38e+00  3.19e+00
    # [22]  1.89e+00  8.96e-01 -1.60e-14
    

    演练:

    • Reduce 首先调用func(x[1], x[2]),让我们调用结果res[1]。然后它调用func(res[1], x[2])(并存储在res[2])。然后func(res[2], x[3])

    • 由于您有不同的第一条件 (if (i == 1)),因此我们使用 init=0 来播种该初始状态。我们也可以这样做:

      func <- function(x) {
        mn <- mean(x)
        Reduce(function(a, b) {
          if (is.null(a)) {
            0 + b - mn
          } else {
            a + b - mn
          }
        }, x, init = NULL, accumulate = TRUE)[-1]
      }
      

      允许更复杂的初始条件。

      由于我们定义了init=,因此在这种情况下我们还需要删除第一个返回值,即[-1]

    1. Reduce 默认只返回最后一个计算值(此处为-1.60e-14),因此我们添加accumulate=TRUE 以捕获所有计算值。

    【讨论】:

    • 非常感谢!我确实会坚持@Cettt 的回答,但你的演练很有教育意义!
    猜你喜欢
    • 2018-12-01
    • 2020-03-03
    • 2016-05-29
    • 2017-11-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-06-01
    • 1970-01-01
    相关资源
    最近更新 更多