【问题标题】:How can I combine two time-series datasets with different time-steps?如何组合具有不同时间步长的两个时间序列数据集?
【发布时间】:2020-03-18 20:55:43
【问题描述】:

我想通过使用来自 MIMIC-1.0MIMIC-3 的 2 个数据集的数据来训练一个多元 LSTM 模型。问题是第一个数据集中记录的生命体征是一分钟一分钟的,而在 MIMIC-III 中,数据是每小时记录一次。两个数据集中的数据记录之间存在间隔差异。

我想通过每 5 分钟向我的模型提供生命体征流/序列来预测生命体征的诊断。如何合并模型的两个数据集?

【问题讨论】:

标签: tensorflow machine-learning merge dataset lstm


【解决方案1】:

您需要能够找到一个可以用来进行合并的通用字段。例如patient_ids 或类似。您可以对 ICU 剧集标识符执行相同的操作。我已经有一段时间没有研究 MIMIC 数据集来准确回忆这些字段是什么了。

【讨论】:

  • 我认为这两个数据集是不同的患者,没有共同的患者id。
  • 好的,知道了。因此数据集属于不同的患者。它们是否共享共同的变量名称(生命值等)?如果是,您可以根据您感兴趣的功能合并数据集。
【解决方案2】:
Dataset Granularity Subsampling for 5-minutely
MIMIC-I Minutely Subsample every 5th reading
MIMIC-III Hourly Interpolate the 10 5-minutely readings between each pair of consecutive hourly readings

您选择的用于获取小时之间读数的插值方法可以像前向填充最后一个值一样简单。如果读数不稳定,more complex method 可能是合适的。

【讨论】:

    猜你喜欢
    • 2021-02-22
    • 1970-01-01
    • 2016-09-04
    • 1970-01-01
    • 2021-01-09
    • 2018-03-21
    • 1970-01-01
    • 1970-01-01
    • 2021-09-05
    相关资源
    最近更新 更多