【发布时间】:2022-01-24 22:30:44
【问题描述】:
在寻找线性回归或 DecisionTreeRegressor 等模型时,最好使用哪个评分?在https://scikit-learn.org/stable/modules/model_evaluation.html 中我们可以看到以下内容:
explained_variance, max_error, neg_mean_absolute_error, neg_mean_squared_error, mean_squared_error, neg_root_mean_squared_error, neg_mean_squared_log_error, neg_median_absolute_error, r2, neg_mean_poisson_deviance, neg_mean_gamma_deviance, neg_mean_absol
但是,对于介绍该领域的人来说,决定使用哪个并不容易。对于简单的线性回归,我会使用 r2 (可能是因为我在学校习惯使用的那个),但这是最好的吗?但是,对于一个decisionTreeRegressor,这个参数也好还是使用另一个更好?
此外,如果在 r^2=1 的情况下(尽管 Anscombe 的四重奏),拟合应该很好。剩下的呢?
【问题讨论】:
-
"哪个是最好的得分?"完全取决于您的用例。不幸的是,了解何时使用每个指标的唯一方法是根据您要解决的问题来研究它们。这有点像问“什么是最好的编程语言?”答案是“视情况而定”
-
我投票结束这个问题,因为它与 help center 中定义的编程无关,而是关于 ML 理论和/或方法 - 请参阅 stackoverflow.com/tags/machine-learning/info 中的介绍和注意事项(适用也在这里)。
标签: python scikit-learn regression scoring