GPflow 多输出变化点答案

【问题标题】：GPflow multi-output change-pointGPflow 多输出变化点
【发布时间】：2021-07-01 11:40:43
【问题描述】：

我想构建一个多输出 GP，其中输出之间的相关结构包含一个变化点。更改应该仅发生在 Coregion 内核的相关结构中，而内核本身（即长度尺度和内核家族）在更改前后应该保持不变。

下面，我提供了一些示例（来自 GPflow 文档 [1., 2.] 和我自己的 [3.]）：

输出之间具有相关结构，但没有变化点，
演示如何在 GPflow 中构建变更点，
我尝试在包含变化点的输出之间建立相关结构。

    X1 = np.random.rand(100, 1)  # Observed locations for first output
    X2 = np.random.rand(50, 1) * 0.5  # Observed locations for second output
    

    Y1 = np.sin(6 * X1) + np.random.randn(*X1.shape) * 0.03
    Y2 = np.sin(6 * X2 + 0.7) + np.random.randn(*X2.shape) * 0.1


    # Augment the input with ones or zeros to indicate the required output dimension
    X_augmented = np.vstack((np.hstack((X1, np.zeros_like(X1))),
                             np.hstack((X2, np.ones_like(X2)))))
                             

    # Augment the Y data with ones or zeros that specify a likelihood from the list of likelihoods
    Y_augmented = np.vstack((np.hstack((Y1, np.zeros_like(Y1))),
                             np.hstack((Y2, np.ones_like(Y2)))))

    output_dim = 2  # Number of outputs
    rank = 1  # Rank of W

    # Base kernel
    k = gpflow.kernels.Matern32(active_dims=[0])

    # Coregion kernel
    coreg = gpflow.kernels.Coregion(output_dim=output_dim, rank=rank, active_dims=[1])

    kern = k * coreg

base_k1 = gpflow.kernels.Matern32(lengthscales=0.2)
base_k2 = gpflow.kernels.Matern32(lengthscales=2.0)
k = gpflow.kernels.ChangePoints([base_k1, base_k2], locations = [0.5], steepness=5.0)

output_dim = 2  # Number of outputs
rank = 1  # Rank of W


# Base kernel
k_base = gpflow.kernels.Matern32(active_dims=[0])

# Coregion kernels
coreg_1 = gpflow.kernels.Coregion(output_dim=output_dim, rank=rank, active_dims=[1])
coreg_2 = gpflow.kernels.Coregion(output_dim=output_dim, rank=rank, active_dims=[1])

k_1 = k_base * coreg_1
k_2 = k_base * coreg_2

k = gpflow.kernels.ChangePoints([k_1, k_2], [0.5], steepness=50.0)
gpflow.set_trainable(k.locations, False); gpflow.set_trainable(k.steepness, False)

当我尝试适应这个时，使用以下代码：

lik = gpflow.likelihoods.SwitchedLikelihood(
    [gpflow.likelihoods.Gaussian(), gpflow.likelihoods.Gaussian()]
)

# now build the GP model as normal
m_change = gpflow.models.VGP((X_augmented, Y_augmented), kernel=k, likelihood=lik)

# fit the covariance function parameters
maxiter = ci_niter(10000)
gpflow.optimizers.Scipy().minimize(
    m_change.training_loss, m_change.trainable_variables, options=dict(maxiter=maxiter), method="L-BFGS-B",
)

我收到错误“尺寸必须相等”，我似乎无能为力。

我的问题是：

我怎样才能让这个模型完全适合？
在目前的状态下，我认为这个设置将适应变化点前后的不同长度尺度，而我只希望输出中的相关结构发生变化。如何将长度尺度设置为相同的单个可训练参数？

请注意：这是我在这里的第一个问题。我已尝试遵守指南，但请提示我的问题是否有更改，使其更适合/可回答。

【问题讨论】：

标签： python gpflow

【解决方案1】：

不幸的是，GPflow 中当前不支持 ChangePoint 内核的 MultiOutput。在您的情况下，这本质上意味着 ChangePoint 内核不知道要执行的输出维度，即使构成它的内核设置了 active_dims 参数。

我有一个正在实施的拉取请求来实现这个功能，你可以在这里找到：https://github.com/GPflow/GPflow/pull/1671

该拉取请求中提出的更改只是要求您在对 ChangePoint 内核的调用中添加一个 switch_dim 标志，如下所示：

k = gpflow.kernels.ChangePoints([k_1, k_2], locations=[0.5], steepness=50.0,
                                switch_dim=1) # <-- This one!

如果您想尝试该功能，可以使用建议的更改安装 GPflow，例如使用 pip，如下所示：

pip install git+https://github.com/GPflow/GPflow.git@refs/pull/1671/head

或者，您可以在 GPflow 源中找到 gpflow/kernels/changepoints.py，并手动实施您在 pull request 中找到的更改。

如果您决定这样做，请注意此提议的更改尚未经过广泛测试，并且不是 GPflow 支持的功能（目前）。

关于您的第二个问题，您当前设置模型的方式仅适用于 ChangePoint 前后的一个 Matern 内核，因为您对 k_1 和 k_2 使用相同的 k_base 实例。这意味着您已经在 CP 的两侧安装了相同的长度尺度，这似乎是您正在寻找的设置。

【讨论】：