【发布时间】:2020-10-01 02:22:39
【问题描述】:
我在statsmodels 中有一个拟合的泊松模型。对于我的每一次观察,我都想计算观察到至少这么高的值的概率。换句话说我要计算:
P(y >= y_i | x_i)
(这应该是可能的,因为拟合模型预测某个值 lambda 作为我的自变量 x 的函数。这个 lambda_i 值定义了一个泊松分布,我应该能够从中得出一个概率。)
我的问题实际上是关于statsmodels 中的实现,而不是关于统计数据。虽然如果您认为它是相关的,请详细说明。
【问题讨论】:
-
不知道我理解的对不对,不过你不就是只需要调用
cdf方法:1 - model.cdf(y_i)吗?我不太了解x_i。 -
我在 Poisson 模型对象上看不到任何
cdf方法。也就是说,x_i上的条件很重要,但它可能会自动包含在模型方法中。它之所以重要,是因为该模型基本上适合每个 x 值的泊松分布。 (泊松分布由 lambda 参数化,其中 lambda 将是 x 的函数。如果我们不使用 x,则所有数据的分布都是相同的,这是不正确的。)
标签: python statsmodels