使用日期时间戳对数据进行聚类

【问题标题】：clustering data with date timestamp使用日期时间戳对数据进行聚类
【发布时间】：2021-11-21 15:09:40
【问题描述】：

除了“时间戳”列（数据框的索引）之外，我还有一个包含 10 个特征的时间序列数据集在缩放特征值并实现 k-means 聚类后，我得到了一个 np.array 的结果。我的问题是我需要知道集群中每个样本的时间戳是什么。如何在不将其用作特征的情况下在聚类时保留时间戳索引？？

【问题讨论】：

【解决方案1】：

天真而简单，但在我看来，好的解决方案是为原始数据帧创建一个新索引 - 只是一个行号 - 然后将数据帧分成两个单独的 - 一个带有时间戳，另一个带有时间戳特征。然后您可以轻松地将结果重新分配给时间戳，因为 fit_predict 将保持顺序。

【讨论】：