R中的递归优化（）函数会导致错误答案

【问题标题】：Recursive optim() function in R causes errorsR中的递归优化（）函数会导致错误
【发布时间】：2021-04-06 04:17:39
【问题描述】：

我正在尝试使用 R 中的 optim() 函数来最小化矩阵运算的值。在这种情况下，我试图最小化一组股票的波动性，这些股票的个人回报彼此共变。被最小化的目标函数是calculate_portfolio_variance。

library(quantmod)

filter_and_sort_symbols <- function(symbols)
{
  # Name: filter_and_sort_symbols
  # Purpose: Convert to uppercase if not
  # and remove any non valid symbols
  # Input: symbols = vector of stock tickers
  # Output: filtered_symbols = filtered symbols
  
  # convert symbols to uppercase
  symbols <- toupper(symbols)
  
  # Validate the symbol names
  valid <- regexpr("^[A-Z]{2,4}$", symbols)
  
  # Return only the valid ones
  return(sort(symbols[valid == 1]))
}

# Create the list of stock tickers and check that they are valid symbols
tickers <- filter_and_sort_symbols(c("AAPL", "NVDA", "MLM", "AA"))
benchmark <- "SPY"
# Set the start and end dates
start_date <- "2007-01-01"
end_date <- "2019-01-01"

# Gather the stock data using quantmod library
getSymbols(Symbols=tickers, from=start_date, to=end_date, auto.assign = TRUE)
getSymbols(benchmark, from=start_date, to=end_date, auto.assign = TRUE)

# Create a matrix of only the adj. prices
price_matrix <- NULL
for(ticker in tickers){price_matrix <- cbind(price_matrix, get(ticker)[,6])}
# Set the column names for the price matrix
colnames(price_matrix) <- tickers
benchmark_price_matrix <- NULL
benchmark_price_matrix <- cbind(benchmark_price_matrix, get(benchmark)[,6])

# Compute log returns
returns_matrix <- NULL
for(ticker in tickers){returns_matrix <- cbind(returns_matrix, annualReturn(get(ticker)))}
returns_covar <- cov(returns_matrix)
colnames(returns_covar) <- tickers
rownames(returns_covar) <- tickers
# get average returns for tickers and benchmark
ticker_avg <- NULL
for(ticker in tickers){ticker_avg <- cbind(ticker_avg, colMeans(annualReturn(get(ticker))))}
colnames(ticker_avg) <- tickers
benchmark_avg <- colMeans(annualReturn(get(benchmark)))

# create the objective function
calculate_portfolio_variance <- function(allocations, returns_covar, ticker_avg, benchmark_avg)
{
  # Name: calculate_portfolio_variance
  # Purpose: Computes expected portfolio variance, to be used as the minimization objective function
  # Input: allocations = vector of allocations to be adjusted for optimality; returns_covar = covariance matrix of stock returns
  #        ticker_avg = vector of average returns for all tickers, benchmark_avg = benchmark avg. return
  # Output: Expected portfolio variance
  
  # get benchmark volatility 
  benchmark_variance <- (sd(annualReturn(get(benchmark))))^2
  # scale allocations for 100% investment
  allocations <- as.matrix(allocations/sum(allocations))
  # get the naive allocations
  naive_allocations <- rep(c(1/ncol(ticker_avg)), times=ncol(ticker_avg))
  portfolio_return <-  sum(t(allocations)*ticker_avg)
  portfolio_variance <- t(allocations)%*%returns_covar%*%allocations
  
  # constraints = portfolio expected return must be greater than benchmark avg. return and
  #               portfolio variance must be less than benchmark variance (i.e. a better reward at less risk)
  if(portfolio_return < benchmark_avg | portfolio_variance > benchmark_variance)
  {
    allocations <- naive_allocations
  }
  
  portfolio_variance <- t(allocations)%*%returns_covar%*%allocations
  return(portfolio_variance)
}


# Specify lower and upper bounds for the allocation percentages
lower <- rep(0, ncol(returns_matrix))
upper <- rep(1, ncol(returns_matrix))

# Initialize the allocations by evenly distributing among all tickers
set.seed(1234)
allocations <- rep(1/length(tickers), times=length(tickers))

当我手动调用目标函数时，它会按预期返回一个值：

> calculate_portfolio_variance(allocations, returns_covar, ticker_avg, benchmark_avg)
          [,1]
[1,] 0.1713439

但是，当我使用 optim() 函数时，它会返回错误：

> optim_result <- optim(par=allocations, fn=calculate_portfolio_variance(allocations, ticker_avg, benchmark_avg), lower=lower, upper=upper, method="L-BFGS-B")
Error in t(allocations) %*% returns_covar : non-conformable arguments

我不确定原因，但可能与optim() 递归使用allocations 变量的方式有关。我能做些什么来解决这个问题？

编辑：FWIW，其他优化策略有效（差分进化，模拟退火），但我更喜欢使用梯度下降，因为它要快得多

【问题讨论】：

很清楚的告诉你t(allocations)的列数和returns_covar的行数不相等。您应该做的是检查这一点并返回一条信息性错误消息，以便此功能的任何其他用户都将从您的远见中受益。另外fn=calculate_portfolio_variance(allocations, ticker_avg, benchmark_avg) 不是函数，而是调用。
@IRTFM 我理解错误；我在问题中详细说明手动调用的原因是因为它不会导致此错误。因此，我的主要问题是为什么在 optim 函数中递归使用分配时维度可能会发生变化。我最初使用 optim_result <- optim(par=allocations, fn=calculate_portfolio_variance, lower=lower, upper=upper, allocations=allocations, ticker_avg=ticker_avg, benchmark_avg=benchmark_avg, method="L-BFGS-B") 但这会导致相同的错误而没有其他详细信息
错误可能相同，但错误原因不同。在第一个实例中，您将 4x1 矩阵乘以 4x1 矩阵并且 cols(1)-rows(2) 不相等；在您评论的第二个实例中，您将 4x1 矩阵乘以 NULL 对象，因为在函数参数构造中没有 returns_covar 的默认值。您应该在该函数中放置一条调试行，在引发错误的行之前打印对象的尺寸。
您还应该对您的功能进行一些测试。目前它对于allocations 的任何值都返回完全相同的值，因此即使它没有抛出错误也没有什么可以优化的。
@IRTFM，啊，是的，你说得对，我忘记了 returns_covar 参数。谢谢你抓住那个。但是，我认为功能不是问题。它可以使用其他非梯度方法进行优化，并且我已经在 Excel 中确认了梯度优化器的结果。

标签： r optimization r-portfolioanalytics

【解决方案1】：

如果将第一个参数重命名为 par 并且您切换将 t() 应用于该侧翼矩阵乘法运算中使用的参数向量的顺序，则不会发生错误：

cpv <- function(par, returns_covar=returns_covar, ticker_avg, benchmark_avg)
{
    # Name: calculate_portfolio_variance
    # Purpose: Computes expected portfolio variance, to be used as the minimization objective function
    # Input: allocations = vector of allocations to be adjusted for optimality; returns_covar = covariance matrix of stock returns
    #        ticker_avg = vector of average returns for all tickers, benchmark_avg = benchmark avg. return
    # Output: Expected portfolio variance
    
    # get benchmark volatility 
    benchmark_variance <- (sd(annualReturn(get(benchmark))))^2
    # scale allocations for 100% investment
    par <- as.matrix(par/sum(par))
    # get the naive allocations
    naive_allocations <- rep(c(1/ncol(ticker_avg)), times=ncol(ticker_avg))
    portfolio_return <-  sum(t(par)*ticker_avg);print(par)
    portfolio_variance <- t(par)%*%returns_covar%*%par
    
    # constraints = portfolio expected return must be greater than benchmark avg. return and
    #               portfolio variance must be less than benchmark variance (i.e. a better reward at less risk)
    if(portfolio_return < benchmark_avg | portfolio_variance > benchmark_variance)
    {
        par <- naive_allocations
    }
    
    portfolio_variance <- t(par)%*%returns_covar%*%par
    return(portfolio_variance)
}

我在代码中留下了par的调试打印，并显示了运行结果的顶部

optim_result <- optim(par=allocations, fn=cpv, lower=lower, upper=upper, returns_covar=returns_covar, ticker_avg=ticker_avg, benchmark_avg=benchmark_avg, method="L-BFGS-B")
     [,1]
[1,] 0.25
[2,] 0.25
[3,] 0.25
[4,] 0.25
          [,1]
[1,] 0.2507493
[2,] 0.2497502
[3,] 0.2497502
[4,] 0.2497502
          [,1]
[1,] 0.2492492
[2,] 0.2502503
[3,] 0.2502503
[4,] 0.2502503
#--- snipped output of six more iterations.

... 结果：

> optim_result 
$par
[1] 0.25 0.25 0.25 0.25

$value
[1] 0.1713439

$counts
function gradient 
       1        1 

$convergence
[1] 0

$message
[1] "CONVERGENCE: NORM OF PROJECTED GRADIENT <= PGTOL"

正如我在对不相关问题的评论中所说，优化函数首先尝试提高然后降低 par 中的第一个元素，然后尝试对第二个、第三个和第四个元素执行相同的操作。那时发现没有任何改进，它“决定”它收敛到局部最小值并宣布收敛。

我应该指出optim 的代码是rather old and the author of the original algorithm, Dr Nash，已经以the optimx package 的形式在CRAN 上放置了一个更新版本。他说optim 在当时很好，但他认为如果不成功，应该尝试其他程序。

【讨论】：

谢谢。出于好奇，您在cpv 函数参数中以这种方式硬编码returns_covar=returns_covar 是否有原因？您已经很好地回答了最初的问题，但我将不得不看看梯度下降是否会起作用或者是否容易陷入局部最小值。
我不确定是否需要 returns_covar=returns_covar。如果没有使用= 传递参数，可能会起作用。而optim 只会找到局部最小值。从未声称要广泛搜索以尝试在全局搜索中找到更好的结果。
感谢您的帮助。我理解梯度方法的缺点是无法确保找到全局最小值，但我希望它在 Excel 中的表现更接近 GRG2 算法。看起来修改 optim 中的步长可能不是在这种情况下提供帮助的最佳主意，所以我可能会更好地使用与 GRG2 的结果更接近的其他优化函数
@coolhand 总是要考虑这个：pages.drexel.edu/~bdm25/chap8.pdf。这是 R-help 引用的基础：stackoverflow.com/questions/15175869/…