constrOptim 函数：优化 R 代码答案

【问题标题】：constrOptim function: Optimize R codeconstrOptim 函数：优化 R 代码
【发布时间】：2016-11-17 15:49:06
【问题描述】：

我正在尝试解决优化问题。

下面是问题的数学解释和我使用的代码：

F = {f_1, f_2, ... f_n}

S = {s_1, s_2, ....s_m}

这里m总是大于n，sum(S)总是大于sum(F)

如果 ST = 转置(S)

求一个矩阵 P (n x m) = {p_ij}，使得：P %* % ST = F，其中 %* % 是矩阵乘法，关于以下约束：

p_ij>= 0，对于所有 i 和 j
sum (p_ij)

由于可能不存在确切的解决方案，我试图通过最小化 [ P %* % ST - F ].[ P %* % ST - F ] 来最小化错误，其中 .是点积

所以问题在于我使用以下代码的约束优化。

F = c(10,10,5)
S = c(8,8,9,8,4)

loss_fun <- function(P){
    T = matrix(S*P, nrow = n,ncol = m, byrow=T)
    F2 = rowSums(T) # Predicted values of F
    E = F - F2  # Error
    return(sum(E*E))    
}

n = length(F)
m = length(S)
P_init = c(rep(0.0001,n*m)) #Initial solution (theta)

# Creating constraint matrix
ui_1 = matrix(0,ncol = n*m, nrow= m) 
for (i in 1:m){
    for (j in 1:(n*m)) {
        if (i%%m==j%%m) ui_1[i,j] = -1
    }
}
ui_2 = diag(1,ncol = n*m, nrow = m*n)
my_ui <- rbind(ui_1,ui_2)

# Creating constraint vector
my_ci = c(rep(-1,m),rep(0,n*m))

z = constrOptim(P_init,loss_fun,NULL,ui=my_ui, ci=my_ci)

#result
P_final = matrix(z$par,nrow=n,byrow=T)

#verification of result
T = t(S*t(P_final)) #proportion matrix * S, transpose to ensure multiplication is by row.
F2 = rowSums(T) # Predicted values of F
E = F - F2  # Error
sum(E*E)

上面的代码运行良好，在我的机器上运行不到 0.5 秒，它有 i5 CPU、4 核、8 GB RAM、64 位 Windows 7 和 64 位 R 3.1.1。

但是，当我在实际问题中使用 F 和 S 时，它运行了大约 15 个小时而没有产生任何输出。 F 有 39 个元素，S 有 196 个。

F = c(212,359,186,396,460,449,206,180,383,264,294,179,256,294,173,415,363,323,389,219,298,338,287,434,195,450,120,460,164,395,198,108,72,345,54,450,420,488,262)
S = c(233.81,0,1.13,59.68,0,768.18,12.33,147.56,115.2,537.32,0,144.35,93.63,13.43,48.58,60,78.26,1280,369.62,8.11,0,342.96,452.99,521.72,4995.58,0,0,10.59,8.1,38.89,161.67,186.14,0,83.22,13.89,37.35,2370,0,0,8.61,4.95,6.31,0,1.53,3600,0,12.48,444.26,0,8490,615.25,27.11,402.95,393.46,1.26,0,44.36,728.85,37.61,159.06,103.63,145.38,0.51,0,0,18.6,3.24,44.5,17.46,210,128.03,19.48,340.79,54.79,54.42,48.48,0,44.76,0,0,0,43.19,102.03,0,0,470,0,101,0,9060,6.09,8.33,49.09,0,19.72,170,57.54,128.78,636.01,10.93,38.79,0,0,49.65,173.58,101.96,21.84,2.55,14.55,770,7419.13,216.21,238.15,582.95,57.93,26.97,71.88,4.63,0,31,103.37,570.58,45.79,540,348.9,151.82,207.41,29.56,51.73,92.25,0,0,51.39,25.14,0,0,95.21,298.94,5.77,154.29,280,1666.59,40.19,0,9.37,119.76,0,0,9.17,28.19,67.5,129.62,85.41,24.59,3607.98,0,130.28,99.57,0,0,0,36.23,1140,328.87,0,0,0,40,22.77,0,2.08,0,0,0,14.66,0,102.86,50.06,13.22,62.25,1410,860,930,646.15,0,0,0,0,890,0,0,12.61,86.4,95.35,19.31,87.74
)

rbind 本身需要 3 到 4 秒，但真正的问题是 constrOptim 所用的时间。

【问题讨论】：

您可能需要提供渐变。
是的，试图计算相同。对我来说似乎很难数学
@ErwinKalvelagen，根据您的建议，我尝试创建渐变并询问我的渐变是否正确：math.stackexchange.com/questions/2018085/…。你能在那里回答吗？
这个模型应该使用一个好的求解器在几秒钟内轻松求解。如果您使用 QP 求解器，则不需要提供梯度。如果您将拟合写为线性约束sum(j, p(i,j)*s(j)) = f(i) + e(i)，其中e 是表示残差的变量，您可以最小化sum(i, sqr(e(i))。像 Cplex 这样好的求解器应该在大约 0.1 秒内解决这个问题。
感谢您提供的信息，但是我无法访问除 R 之外的任何内容。另外，我不完全理解您编写的约束语法，请您详细说明一下。

标签： r optimization

【解决方案1】：

由于你的约束比较简单，当你使用一些可以将函数作为约束参数的包时，可以避免在约束部分进行大矩阵计算，例如alabama。

loss_fun <- function(P){
  T = matrix(S*P, nrow = n,ncol = m, byrow=T)
  F2 = rowSums(T) # Predicted values of F
  E = F - F2  # Error
  return(sum(E*E))    
}

n = length(F)
m = length(S)
P_init = c(rep(0.0001, n*m)) #Initial solution (theta)

# Creating inequality constraint function (this is much faster than my_ui %*% P - my_ci)
hin <- function(P){
  P_mat <- matrix(P, nrow = m)
  c(rowSums(P_mat) * -1 +1, P)
}

library(alabama)
aug_res <- auglag(P_init, loss_fun, hin = hin, control.outer = list(kkt2.check = FALSE))

【讨论】：

非常感谢您的回答，我将首先针对我的代码针对较小的问题进行测试，然后让您知道
感谢@cuttlefish44，在对较小规模的问题进行测试时，您的代码速度提高了 10 倍以上。所以我在我的真正问题上运行了你的答案，花了 6813 秒（大约 2 小时）。我读到（正如@ErwinKalvelagen 所说），专门针对高维问题放置渐变可能会更快，我将渐变创建为：gr <- function(P){ P_mat = matrix(P,nrow=n,byrow=T); gr = -2 * ((F - P_mat %*% S)) %*% t(S) }。但是，当我使用渐变运行 auglag 时，结果会有所不同。我确定我在构造梯度函数时犯了一些错误
我需要再添加一个约束，一些 p_ij 必须为 0。我试图实现它，但出现错误。你能帮我解决这个问题吗？这就是我编写等式约束的方式 - heq <- function(P) { P[which(P==0)] }
第 8 次迭代后出现错误：Error in colSums(lam[-inactive] * ij) : 'x' must be an array of at least two dimensions 此外，在第 8 次迭代时，我可以看到我想要的值，因为 0 大于 0。
@Gaurav Singhal;对不起，我希望我能帮助你，但我不能。部分 p_ij 为 0 由sum(P == 0) > 0 表示。但它看起来是离散值的问题，我不知道有一个包用连续值处理这种问题。当我使用prod(P) == 0 时，prod(P) 近似为 0，但 P 的所有元素都是 > 0。