【发布时间】:2020-12-13 04:18:47
【问题描述】:
我正在尝试解决受 Python 中不等式约束的线性系统影响的最小二乘问题。我已经能够在 MatLab 中解决这个问题,但是对于我正在工作的项目,我们所有的代码库都应该是 Python,所以我正在寻找一种等效的方法来解决它,但一直无法解决。
问题的一些背景:
我的图像具有原始数字 (DN) 形式的像素值,我想提出一条回归线,用于模拟 DN 与图像中表面的真实反射率值之间的线性关系。
我有 6 个已知的反射率和对应的 DN,因此我建立了一个线性方程组:
import numpy as np
A = np.array([[1, 19039],[1, 47792], [1, 9672], [1, 32521], [1, 11409], [1, 58843]])
b = np.array([[0.05938044], [0.27213514], [0.00252875], [0.18535543], [0.01959069], [0.52605937]])
b = np.squeeze(b)
我将目标函数设置为 (Ax-b)*0.5 的 2-范数
def f(, x):
# function to minimize
y = np.dot(A, x) - b
return (np.dot(y, y))*.5
然后我想添加我的约束。由于表面反射率值介于 0-1 之间,我想确保我的图像中的最小 DN 值在通过估计斜率和截距系数从 DN 转换为反射率时具有大于 0 的反射率值,并且最大 DN 值图像的反射率被映射到低于或等于 1。
根据我正在实现的paper,我可以将0 <= slope*DN + intercept <= 1的需求分成两部分:
slope*DN_max + intercept <= 1
-slope*DN_min - intercept <= 0
因此,我创建了两个矩阵,一个包含最小 DN 值和截距系数 (1),另一个包含最大 DN 值和截距系数 (1)。我将它们制成矩阵,因为在实践中我将校准不止一个图像,因此我将有超过两列和两行(我将有 n x n*2 矩阵,其中 n = 图像数),但是对于这个简化的示例,我将只使用一张图片。
img_min = 0
img_max = 65536
C_min = np.array([[-1, img_min]])
C_max = np.array([[1, img_max]])
def cons_min(x):
# constraint function for the minimum pixel values
return np.array((C_min @ x))
def cons_max(x):
# constraint function for the maximum pixel values
return np.array((C_max @ x))-1
然后我尝试使用 optimize.minimize 来求解系数。
con1 = [{'type': 'ineq', 'fun': cons_min},
{'type': 'ineq', 'fun': cons_max}
]
initial = [0, 0]
result = optimize.minimize(f,
initial,
method='SLSQP',
constraints=con1
)
在 MatLab 中使用 lsqlin(A,B, C, c) 函数得到的结果是
intercept = 0.0000000043711483450798073327817072630808
slope = 0.0000069505505573854644717126521902273
但是使用我得到的 optimize.minimize 函数
[-2.80380803e-17, 1.52590219e-05]
我认为这可能是我设置的约束有问题,但我尝试过使用它们,但并没有以任何方式改善结果。
有没有更好的方法在 Python 中解决这个问题?或者我目前的方法有什么可以改进的地方吗?
谢谢。
【问题讨论】:
-
看到这是一个缩放问题我不会感到惊讶。 SLSQP 太笼统(NLP)并且太不稳健(与更专业的方法相比;啊,你也在做数值差异),当预计决策变量在 10e-5 - 10e-8 范围内时,这可能会完全失败。这实际上甚至可能是它的一阶停止标准的范围。 Solver-status 可能表明存在此类问题。除此之外,scipy 可能不是我在这里的第一选择,因为它在这方面受到限制。更有效的 hack 是 pyomo + ipopt(但即使这样也不太专业)。
-
恕我直言,您想要一个凸 qp-solver 或 socp-solver(均基于内点方法)。可悲的是,没有多少好的软件可用(当受到许可证或包装器的限制时)。除非你正在做(许可兼容的)学术工作:那么只需使用 CPLEX、Gurobi 或 Mosek。 编辑您也可以在cvxpy 中用几行代码 来描述这一点,并尝试ECOS(最准确)、OSQP 或SCS(都不太准确)。可能仍需要缩放。另外:如果这种方法失败(使用 ECOS),那么您遇到一些其他问题(然后是求解器)的机会就会增加,因为求解器非常好
-
感谢您的提示!它最终通过使用 cvxpy 和 ECOS 求解器来工作!带有约束的 cvxpy 的设置也比使用 scipy 简单得多,所以我对这种方法非常满意!如果您想将您的评论变成答案,那么我很乐意将其标记为解决方案。
标签: python optimization scipy constraints least-squares