【发布时间】:2018-06-07 17:31:59
【问题描述】:
我有一个类似这样的时间序列数据
Loan_id Loan_amount Loan_drawn_date
id_001 2000000 2015-7-15
id_003 100 2014-7-8
id_009 78650 2012-12-23
id_990 100 2018-11-12我正在尝试在此数据上构建一个 Arima 预测模型,该模型有大约 550 个观测值。这些是我遵循的步骤
将时间序列数据转换为每日数据,并将NA值替换为0。数据看起来像这样
Loan_id Loan_amount Loan_drawn_date
id_001 2000000 2015-7-15
id_001 0 2015-7-16
id_001 0 2015-7-17
id_001 0 2015-7-18
id_001 0 2015-7-19
id_001 0 2015-7-20
....
id_003 100 2014-7-8
id_003 0 2014-7-9
id_003 0 2014-7-10
id_003 0 2014-7-11
id_003 0 2014-7-12
id_003 0 2014-7-13
....
id_009 78650 2012-12-23
id_009 0 2012-12-24
id_009 0 2012-12-25
id_009 0 2012-12-26
id_009 0 2012-12-27
id_009 0 2012-12-28
...
id_990 100 2018-11-12
id_990 0 2018-11-13
id_990 0 2018-11-14
id_990 0 2018-11-15
id_990 0 2018-11-16
id_990 0 2018-11-17
id_990 0 2018-11-18
id_990 0 2018-11-19
谁能建议我现在如何继续使用这些 0 值?
看到贷款金额数字的差异,我会记录贷款金额的日志。我正在尝试第一次构建 ARIMA 模型,并且我已经阅读了所有插补方法,但我找不到任何东西。谁能告诉我如何继续处理这些数据
【问题讨论】:
-
"Can Someone Help Me?" is not a valid SO question。这通常表明您需要的是与当地导师一起半小时或完成教程,而不是 Stack Overflow。 SO 用于特定的编程问题;看来您需要完成有关 Armina 建模的教程。
-
@Prune--- 我是 ARIMA 建模的初学者,我只是想了解 0 值是否可以用任何数字替换。手段和模式不会担心,这就是我在这里发布这个问题的原因。
-
建立ARIMA模型:analyticsvidhya.com/blog/2016/02/…你可以参考这个网站建立模型
-
我认为,如果您发布尝试处理插补的代码,您将获得更好的帮助。就您的问题而言,这似乎是对场外资源或综合设计的请求,其中任何一个都与 SO 无关。
标签: python time-series missing-data arima