【发布时间】:2021-12-23 03:28:37
【问题描述】:
在图片中,我绘制了形状数组 (400,8) 中的值 我希望重新组织点以获得 8 系列“连续”点。我们称它们为 a(t)、b(t)、..、h(t)。 a(t) 是具有较小值的系列,而 h(t) 是具有较大值的系列。它们是未知的,我试图获得它们
我有一些缺失值被 0 替换。
当有0时,我不知道它属于哪个serie。零总是以高索引存储在数组中 例如,在时间 t=136 我只有 4 个有效值。然后 array[t,i] > 0 for i 3
如何以我得到“连续”时间序列的方式对点进行聚类,即在时间 t=136,array[136,0] 应该进入 d,array[136,1] 应该进入 e,array [136,2] 应该进入 f 并且 array[136,3] 应该进入 g
我用 scikit-learn 尝试了 AgglomerativeClustering 和 DBSCAN,但没有成功。
数据可在https://drive.google.com/file/d/1DKgx95FAqAIlabq77F9f-5vO-WPj7Puw/view?usp=sharing获取
【问题讨论】:
-
你的数组的形状是 (400,8),你知道零在哪里。你到底想做什么?
标签: python numpy scikit-learn cluster-analysis