【问题标题】:Plotting confidence interval around predicted line plot围绕预测线图绘制置信区间
【发布时间】:2020-09-16 11:00:48
【问题描述】:

我正在尝试围绕折线图绘制置信区间,类似于:https://scikit-learn.org/0.17/_images/plot_gp_regression_001.png

我正在拟合一个高斯过程,并且在预测值时,对于每个值,它都会返回一个平均值和一个标准差(标准差)。使用它,我应该能够绘制不同范围的置信区间。就我而言,我试图将范围设置为 10%、20%、... 90%。

目前我正在做这样的事情

y_pred, std = reg.predict(x, return_std=True)

std_z = 1.96 # from z-table for 95%
confidence_interval = std * std_z

plt.plot(x, y_pred)    
plt.fill_between(x, y_pred - confidence_interval, y_pred + confidence_interval)

这行得通。根据 z 表 (http://www.z-table.com/uploads/2/1/7/9/21795380/8573955.png?759),可以看到 z 值为 1.96,表示 95%。但是,以 25% 和 75% 为例。这些 z 值将分别为 - 和 + 0.67,在绘图时它们只会在置信区间中重叠。这在我看来直觉上是不正确的。我预计较低的置信度范围会缩小,而增加的置信度范围会扩大,对吗?

任何帮助将不胜感激。

【问题讨论】:

    标签: python r plot statistics confidence-interval


    【解决方案1】:

    错了。与置信区间相关的百分比(在您的示例中为 95%、75%、25%)是覆盖概率。它们是您估计的数量的真实值(在这种情况下为预测值)位于 CI 内的机会。鉴于您正在谈论的 CI 是中心置信区间(也就是说,它们以预测值)按理说,要获得更高的置信度,您需要更宽的区间。这正是您所看到的。如果更窄的置信区间比更宽的置信区间具有更高的覆盖概率,那么这意味着存在一个区域以某种方式具有与其相关的负覆盖概率。概率不能为负,所以这是不可能的。

    【讨论】:

      猜你喜欢
      • 2022-01-13
      • 1970-01-01
      • 2018-02-05
      • 2017-02-12
      • 2016-05-02
      • 1970-01-01
      • 2021-12-21
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多