【发布时间】:2026-01-05 22:50:01
【问题描述】:
我有一些异常值的数据集。 从简单的线性回归,使用
stat_lin = stats.linregress(X, Y)
可以得到系数、截距、r_value、p_value、std_err
但我想应用稳健的回归方法,因为我不想包含异常值。
所以我应用了来自 Sklearn 的 Huber 回归器,
huber = linear_model.HuberRegressor(alpha=0.0, epsilon=1.35)
huber.fit(mn_all_df['X'].to_numpy().reshape(-1, 1), mn_all_df['Y'].to_numpy().reshape(-1, 1))
从中,我可以得到系数、截距、尺度、异常值。
我对结果感到满意,因为系数值更高,并且回归线与大多数数据点拟合。
但是,我需要一个诸如 r 值和 p 值之类的值来说明 huber regressor 的结果是显着的。
如何从稳健回归中获得 r 值和 p 值(我的案例,使用 huber 回归器)
【问题讨论】:
标签: python regression robust