【发布时间】:2011-12-17 20:08:32
【问题描述】:
我有一个包含 n 个数据的数据集,其中每个数据都由一组提取的特征表示。通常,聚类算法需要所有输入数据具有相同的维度(相同数量的特征),即输入数据 X 是由 n 个数据点组成的 n*d 矩阵,每个数据点具有 d 个特征。 在我的例子中,我之前已经从我的数据中提取了一些特征,但是每个数据的提取特征的数量很可能是不同的(我的意思是,我有一个数据集 X,其中数据点的特征数量不同)。 有什么方法可以调整它们,以便使用一些要求数据具有相同维度的常见聚类算法对它们进行聚类。
谢谢
【问题讨论】:
标签: cluster-analysis dimensionality-reduction