【发布时间】:2020-09-23 02:23:54
【问题描述】:
我有很多这样的数据序列:
s1 = t11, t12, ..., t1m_1
s2 = t21, t22, ..., t2m_2
...
si = ti1, ti2, ..., tim_i
si means the i-th sequence, tij means the i-th sequence be accessed at time tj
每个序列的数据长度不同(m_1可能不等于m_2),
每个序列的数据表示序列si被访问的时间为ti1, ti2, ..., tim_i。
我的目标是对相似的访问时间序列进行聚类。
我不确定是否可以将此问题转化为时间序列问题。
就我的理解而言,每个序列的数据都像股票数据一样表示当时的值,但我的序列值表示访问序列的时间。
如果它可以转化为时间序列问题,但还有另一个问题。问题是序列的访问时间非常离散(可能在1s、1000s、2000s时访问),所以如果我翻译成时间序列格式,它的空间会很大,我认为这不能运行cluster with some (DTW)这样的算法,它的时间复杂度可能太大了。
【问题讨论】:
-
欢迎来到 Stack Overflow!希望您觉得该网站有用。
标签: time-series cluster-analysis