【发布时间】:2013-07-29 03:50:57
【问题描述】:
这两种方法我都试过了,但我发现两种方法都有困难.. 在我用这两种方法告诉你我的问题之前,我会尝试更好地解释我的问题。
我有数据集“acceptances”,其中我有医院每天的接受数量,其中包含前面描述的独立变量。医院有三个地方可以进行访问。所以在我的数据集中,我每天有 3 行,每个地方都有一行。数据集看起来像:
Date Place NumerAccept weekday month NoConvention Rain
2008-01-02 Place1 203 wed Gen 0 1
2008-01-02 Place2 70 wed Gen 0 1
2008-01-02 Place3 9 wed Gen 0 1
2008-01-03 Place1 345 thu Gen 0 1
2008-01-03 Place2 24 thu Gen 0 1
2008-01-03 Place3 99 thu Gen 0 1
2008-01-04 Place1 339 fri Gen 0 0
2008-01-04 Place2 36 fri Gen 0 0
2008-01-04 Place3 101 fri Gen 0 0
....等等...我有数据集直到昨天,所以最后三行是 2013 年 7 月 29 日昨天的接受。 现在我进行泊松回归:
poisson_reg=glm(NumeberAccept ~ 1 + weekday + month + place + NoConvention + Rain,
family = poisson(link = log), data = acceptances)
现在,对于我的预测,我创建了一个新的数据集acceptances_2,我想从中计算未来 2 个月的接受数的预测间隔!!所以第一行是今天的录用数,最后一行是9月29日的录用数。
我不知道这个问题是否已经有了答案,但我找不到。我正在尝试在 R 中进行泊松回归,并且我想获得预测区间。我看到lm 的预测函数给它写'interval="prediction"' 但它不适用于predict.glm!
有人知道是否有办法获得这些预测区间吗?有例子可以打代码吗?
所以我要数一数医院每天接受的人数,我有以下代码:
poisson_reg=glm(NumeberAccept ~ 1 + weekday + month + place + NoConvention + Rain,
family = poisson(link = log), data = dataset)
summary(poisson_reg)
现在如果我输入 R predict(poisson_reg, newdata, type="responce") 我可以预测每天的接受次数,但我也需要预测间隔!
我看到,对于预测调用中的 "lm" 类对象,您可以编写:predict(poisson_reg, newdata, interval="prediction"),它给出了 95% 的预测区间。有没有办法用 "glm" 类的对象获得相同的结果?
【问题讨论】:
-
这没有那么简单。不像在线性模型的情况下,可以简单地将由于参数不确定性引起的方差添加到估计的误差方差中以获得总体预测方差,这里您可能需要从参数的抽样分布(或自举分布)中进行模拟,然后从条件泊松分布中进行模拟,并收集相关的置信包络。
-
@本:别以为我跟着你..你能举个例子吗? @Frank:Confint 不行,因为我需要预测区间而不是置信区间..
标签: r regression intervals prediction poisson