【发布时间】:2021-11-21 15:09:40
【问题描述】:
除了“时间戳”列(数据框的索引)之外,我还有一个包含 10 个特征的时间序列数据集 在缩放特征值并实现 k-means 聚类后,我得到了一个 np.array 的结果。 我的问题是我需要知道集群中每个样本的时间戳是什么。如何在不将其用作特征的情况下在聚类时保留时间戳索引??
【问题讨论】:
标签: time-series timestamp cluster-analysis k-means
除了“时间戳”列(数据框的索引)之外,我还有一个包含 10 个特征的时间序列数据集 在缩放特征值并实现 k-means 聚类后,我得到了一个 np.array 的结果。 我的问题是我需要知道集群中每个样本的时间戳是什么。如何在不将其用作特征的情况下在聚类时保留时间戳索引??
【问题讨论】:
标签: time-series timestamp cluster-analysis k-means
天真而简单,但在我看来,好的解决方案是为原始数据帧创建一个新索引 - 只是一个行号 - 然后将数据帧分成两个单独的 - 一个带有时间戳,另一个带有时间戳特征。然后您可以轻松地将结果重新分配给时间戳,因为 fit_predict 将保持顺序。
【讨论】: