【问题标题】:Time series data prediction with multiple n numbers具有多个 n 数的时间序列数据预测
【发布时间】:2020-10-25 15:52:11
【问题描述】:

我正在研究时间序列数据。

如果您查看到目前为止使用示例运行的时间序列数据,它们同样只有两列。一个是日期,一个是任意值。

例如,在股票价格上涨预测的情况下,我们预测“单一”股票。

如果可以,您能否在时间序列数据分析中同时预测多只股票?

例如,在受试者服用影响其肝脏水平的药物后,他们获得了截至日期的肝脏计数数据。基于此,我想尝试预测未来肝脏水平上升或下降的时间点。这时候,我需要同时预测几个病人,而不是一个病人。这种情况下如何指定数据集?

是否可以通过添加一列来标记?还是我真的不了解时间序列数据分析的本质?

如果有人知道任何相关信息,如果您能给我建议或给我一个参考网站,我将不胜感激。

【问题讨论】:

    标签: python machine-learning time-series


    【解决方案1】:

    您应该分别对每位患者进行预测。您可能不希望对其中一位患者的预测因同时发生在其他人身上的事情而发生变化。

    机器学习不仅仅是将数据提供给模型并获取结果,您还必须考虑模型,在这里它的输入和输出应该是什么。对于时间序列,您可能会将前几天在患者身上观察到的内容作为输入,并尝试预测下一天会发生什么。对于一名患者,您不需要其他患者的数据,如果将其提供给您的模型,它会尝试使用它并从训练数据中捕获一些噪音,这不是您想要的。

    但是,由于您可以预期每位患者的行为相似,您可以为所有患者建立一个模型,而不是为每位患者建立一个模型。典型的输入格式为:

    [X(t - k, i), X(t - k + 1, i), ..., X(t - 1, i)]

    其中 X(t, i) 是患者 i 在时间 t 的观察结果,用于预测 X(t, i)。使用所有患者的数据训练您的模型。

    当您举一个医学示例时,请注意,如果您有一些协变量,例如患者的体重或性别,您可以将它们包含在您的模型中,以捕捉他们的个体特征。在这种情况下,预测 X(t, i) 的模型输入将是:

    [X(t - k, i), X(t - k + 1, i), ..., X(t - 1, i), C1(i), ..., Cp(i) ]

    其中 C1(i)...Cp(i) 是患者的协变量。如果您没有这些协变量,这不是问题,它们可以在某些情况下改善结果。请注意,所有协变量都不一定有用。

    【讨论】:

    • 感谢您的回答!这是我理解的吗? 1、在时间序列数据的模型中,不能通过给患者的数据集打标签来一次训练模型。 2.因此,每个患者都应该接受每个数据集的训练并查看结果。
    • 不完全是。您可以一次训练模型,但是在一次“观察”中,您只能提供一名患者的数据。
    猜你喜欢
    • 2021-05-10
    • 1970-01-01
    • 1970-01-01
    • 2017-11-22
    • 2023-03-14
    • 2018-04-03
    • 2022-10-24
    • 2019-01-03
    相关资源
    最近更新 更多