【问题标题】:Creating Distance Matrix for Time Series in R在 R 中为时间序列创建距离矩阵
【发布时间】:2014-09-19 09:32:56
【问题描述】:

我有一个包含大约 400 个双变量时间序列的数据集,每个时间序列包含大约 80,000 个观测值。手动查看它们后,很明显有些非常相似,因此我想使用 DTW(动态时间扭曲)对它们进行聚类。

现在,如果我尝试使用 DTW 方法为整个集合创建距离矩阵,R 告诉我它需要 50 GB 的 RAM(我没有)。是否可以使用 for 循环(或类似方法)分别计算两个时间序列之间的距离?

您会推荐哪些其他距离方法用于聚类时间序列?

【问题讨论】:

    标签: r matrix time-series distance


    【解决方案1】:

    如果你天真地做 DTW,它是二次的,你的矩阵将有 6400000000 个元素,因此是 50 gig

    但是,如果您只需要距离而不需要路径,则可以一次只使用两列进行 DTW,只需 160000 个元素,不到 1 兆字节

    不过还是有一些坏消息,空间复杂度不是问题,但时间复杂度会害死你。

    但是,也有一些技巧,例如下采样 [a] 可能会有所帮助。

    如果您需要更多帮助,请通过电子邮件发送 [a](我)的最后作者

    [a]http://www.cs.ucr.edu/~eamonn/SIGKDD_trillion.pdf

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2016-12-29
      • 2015-06-11
      • 1970-01-01
      • 1970-01-01
      • 2022-08-17
      • 2019-03-16
      • 1970-01-01
      相关资源
      最近更新 更多