【发布时间】:2019-11-24 12:34:56
【问题描述】:
上下文:所以我有一个包含 32k 图像的数据集,每个图像都是 200x200 并且是黑白的。我将 200x200 的照片按行主要顺序变成了 40k 的单一尺寸。我基本上有一个 32k x 40k 的 numpy 矩阵,第一个值是图像索引,第二个值是 1 或 0,用于该特定图像的像素索引。我在上面运行了 MiniBatkKmeans:
with open('np_array.pickle', 'rb') as handle:
np_list = pickle.load(handle)
# used a batch system for k mean so my machine doesn't run out of memory
mbk = MiniBatchKMeans(init='k-means++', n_clusters=5,
batch_size=200,
max_no_improvement=10, verbose=0)
mbk.fit(np_list)
现在我想知道“查看”这个数据集以及所有形成的集群的最佳方式是什么,如果可能的话,每张照片都相互关联。
【问题讨论】:
标签: python scikit-learn cluster-analysis data-visualization k-means