【发布时间】:2019-05-20 10:09:56
【问题描述】:
我有一个数据框,其中包含不同位置的气候值,例如 temperature_max、temperature_min...。数据收集是时间序列数据,有一些特定的日子没有数据登记。我想估算考虑日期和位置(在数据框中放置变量)
我试图用amelia 来估算那些缺失值。但是没有对警告信息进行插补
检查变量:
head(df): PLACE, DATE, TEMP_MAX, TEMP_MIN, TEMP_AVG
PLACE DATE TEMP_MAX TEMP_MIN TEMP_AVG
F 12/01/2007 19.7 2.5 10.1
F 13/01/2007 18.8 3.5 10.4
F 14/01/2007 17.3 2.4 10.4
F 15/01/2007 19.5 4.0 9.2
F 16/01/2007
F 17/01/2007 21.5 2.8 9.7
F 18/01/2007 17.7 3.3 12.9
F 19/01/2007 18.3 3.8 9.7
A 16/01/2007 17.7 3.4 9.7
A 17/01/2007
A 18/01/2007 19.7 6.2 10.4
A 19/01/2007 17.7 3.8 10.1
A 20/01/2007 18.6 3.8 12.9
这只是我的数据集的一些记录。
DF = amelia(df, m=4, ts= c("DATE"), cs = c("PLACE"))
其中 DATE 是时间序列数据(2001 年 1 月 1 日、2001 年 2 月 1 日、2001 年 3 月 1 日...),但如果按 PLACE 过滤,则时间序列不相等(不是同一个星号和结尾时间)。
我有 3 个问题:
我不确定是否应该为所有地点提供完整的时间序列数据,我的意思是所有地点的开始和结束时间相同。
我没有使用滞后或多时间参数,所以我是否在考虑时间序列影响的情况下正确估算?虽然我检查了 R 包信息,但我不确定如何使用 lag 参数。
最后一个问题是,当我尝试使用该代码时,会出现警告 并且没有进行任何插补。
警告:数据中存在完全缺失的观察结果。 这些观察结果将在最终数据集中保持不变。
-- 插补1--
自举样本中没有丢失数据:EM 链是不必要的
-- 插补2--
自举样本中没有丢失数据:不需要 EM 链
-- 插补3--
自举样本中没有丢失数据:不需要 EM 链
-- 插补4--
自举样本中没有丢失数据:不需要 EM 链
有人可以帮我解决这个问题吗?
非常感谢您的宝贵时间!
【问题讨论】:
-
请添加您的一些数据,因为这是不可重现的。还要确保指定您正在使用的所有包以及导致错误的代码行。不知道你到底做了什么,很难提供帮助。
-
阿米莉亚上周工作正常。现在,通过使用上周工作的相同代码,我收到了相同的消息错误。虽然不知道发生了什么。
-
我联系了包的作者。我会及时通知你。
标签: r missing-data