您得到不同结果的原因是您的颜色分割算法使用了k-means clustering。我假设你不知道这是什么,因为熟悉它的工作原理的人会立即告诉你,这就是为什么你每次都会得到不同的结果。事实上,每次运行这段代码后得到的不同结果是 k-means 聚类的自然结果,我将解释原因。
它的工作原理是,对于您拥有的某些数据,您希望将它们分组到 k 个组中。您最初在数据中选择 k 个随机点,这些点将具有来自 1,2,...,k 的标签。这些就是我们所说的质心。然后,您确定其余数据与这些点的接近程度。然后,您将这些点分组,以便无论哪个点最接近这些 k 点中的任何一个,您都将这些点分配给该特定组 (1,2,...,k)。之后,对于每个组的所有点,您更新 质心,它实际上被定义为每个组的代表点。对于每个组,您计算每个 k 组中所有点的平均值。这些成为下一次迭代的新质心。在下一次迭代中,您将确定数据中的每个点与每个质心 的距离。您不断迭代并重复此行为,直到质心不再移动,或者它们移动很少。
这适用于上述代码的原因是您正在拍摄图像并且您希望仅使用 k 种可能的颜色来表示图像。因此,这些可能的颜色中的每一种都是质心。一旦找到每个像素所属的集群,您将用像素所属的集群的质心替换像素的颜色。因此,对于图像中的每个颜色像素,您需要确定在 k 种可能的颜色中使用哪种颜色可以最好地表示该像素。这是颜色分割的原因是因为您将图像 分割 使其仅属于 k 种可能的颜色。在更一般的意义上,这就是所谓的无监督分割。
现在,回到k——意思。你如何选择初始质心是你得到不同结果的原因。您正在以默认方式调用 k-means,它会自动确定算法将从哪些初始点中选择。因此,不保证每次调用算法时都会生成相同的初始点。如果您想重复相同的分段,无论您调用多少次kmeans,您都需要自己指定初始点。因此,您需要修改 k-means 调用,使其看起来像这样:
[cluster_idx, cluster_center] = kmeans(ab,nColors,'distance','sqEuclidean', ...
'Replicates', 3, 'start', seeds);
请注意,调用是相同的,但我们在 k-means 调用中添加了两个附加参数。标志 start 表示您正在指定初始点,seeds 是一个 k x p 数组,其中 k 是您想要的组数。在这种情况下,这与nColors 相同,即3。p 是数据的维度。由于您转换和重塑数据的方式,这将是 2。因此,您最终指定了一个 3 x 2 矩阵。但是,那里有一个 Replicate 标志。这意味着 k-means 算法将运行您指定的一定次数,并且它将输出具有最少错误量的分段。因此,我们将重复 kmeans 调用此标志指定的次数。 seeds 的上述结构将不再是k x p 而是k x p x n,其中n 是您要运行分段的次数。现在这是一个 3D 矩阵,其中每个 2D 切片确定算法每次运行的初始点。请记住这一点,以备后用。
如何选择这些积分取决于您。但是,如果您想随机选择这些而不是由您自己决定,而是想在每次调用此函数时重现相同的结果,您应该将random seed generator 设置为已知数字,例如123。这样,当您生成随机点时,它将始终生成相同的点序列,因此是可重现的。因此,我会在调用 kmeans 之前将其添加到您的代码中。
rng(123); %// Set seed for reproducibility
numReplicates = 3;
ind = randperm(size(ab,1), numReplicates*nColors); %// Randomly choose nColors colours from data
%// We are also repeating the experiment numReplicates times
%// Make a 3D matrix where each slice denotes the initial centres for each iteration
seeds = permute(reshape(ab(ind,:).', [2 nColors numReplicates]), [2 1 3]);
%// Now call kmeans
[cluster_idx, cluster_center] = kmeans(ab,nColors,'distance','sqEuclidean', ...
'Replicates', numReplicates, 'start', seeds);
请记住,您指定了 Replicates 标志,我们希望重复此算法一定次数。这是3。因此,我们需要为算法的每次运行指定初始点。因为我们将有 3 个点集群,并且我们将运行这个算法 3 次,所以我们总共需要 9 个初始点(或nColors * numReplicates)。每组初始点都必须是 3D 数组中的一个切片,这就是为什么您会在 kmeans 调用之前看到那个复杂的语句。
我将重复次数设为变量,这样您就可以随心所欲地更改它,它仍然可以工作。 permute 和 reshape 的复杂语句使我们能够非常轻松地创建这个 3D 点矩阵。
请记住,MATLAB 中对randperm 的调用最近才接受第二个参数。如果上述对randperm 的调用不起作用,请改为:
rng(123); %// Set seed for reproducibility
numReplicates = 3;
ind = randperm(size(ab,1)); %// Randomly choose nColors colours from data
ind = ind(1:numReplicates*nColors); %// We are also repeating the experiment numReplicates times
%// Make a 3D matrix where each slice denotes the initial centres for each iteration
seeds = permute(reshape(ab(ind,:).', [2 nColors numReplicates]), [2 1 3]);
%// Now call kmeans
[cluster_idx, cluster_center] = kmeans(ab,nColors,'distance','sqEuclidean', ...
'Replicates', numReplicates, 'start', seeds);
现在有了上面的代码,你应该可以每次都生成相同的颜色分割结果了。
祝你好运!