【发布时间】:2017-10-30 16:55:02
【问题描述】:
我有一个用于估计 RStan 中的模型(有点复杂的模型)的贝叶斯代码。在估计模型后,我从后验分布中抽取了 500 个参数集样本,以模拟未来(下 1 个月)模型中的数据。最后,我取了预测值的平均值(每个时间点 500 个预测值),然后将它们与实际观察值进行比较(带图)。
我的问题是 - 我如何计算这些预测值均值的区间?
示例:从后验分布中抽取参数样本后,我使用这些参数从模型中模拟了变量 X1、X2、....X30:
X1= (33,25,10,19,25)
X2= (11,10,15,13.5,17)
.......
X30= (40,33.3,50,29,45.1)
现在我发现 mean(X1); mean(X2);....mean(X30) 并根据时间绘制它们。我想找到这些方法的区间。
【问题讨论】:
-
我不明白您所说的“计算预测值的这些均值的区间”是什么意思......你想要什么样的区间?此外,有一些最小的例子会使问题变得具体。我建议创建一个玩具示例,您可以在其中发布一个小型数据集和代码。
-
@ssp3nc3r 嗨,我想要某种“预测区间”来表示预测值的平均值。我在上面提供了一个玩具示例。
-
如果您的意思是可信区间,例如 X1 代表多个后验抽签,那么您可以执行类似
quantile(X1, probs = c(.1, .9))之类的操作,它提供了中间 80% 的抽签。