【问题标题】:sklearn scoring for regression [closed]用于回归的sklearn评分[关闭]
【发布时间】:2022-01-24 22:30:44
【问题描述】:

在寻找线性回归或 DecisionTreeRegressor 等模型时,最好使用哪个评分?在https://scikit-learn.org/stable/modules/model_evaluation.html 中我们可以看到以下内容:

explained_variance, max_error, neg_mean_absolute_error, neg_mean_squared_error, mean_squared_error, neg_root_mean_squared_error, neg_mean_squared_log_error, neg_median_absolute_error, r2, neg_mean_poisson_deviance, neg_mean_gamma_deviance, neg_mean_absol

但是,对于介绍该领域的人来说,决定使用哪个并不容易。对于简单的线性回归,我会使用 r2 (可能是因为我在学校习惯使用的那个),但这是最好的吗?但是,对于一个decisionTreeRegressor,这个参数也好还是使用另一个更好?

此外,如果在 r^2=1 的情况下(尽管 Anscombe 的四重奏),拟合应该很好。剩下的呢?

【问题讨论】:

  • "哪个是最好的得分?"完全取决于您的用例。不幸的是,了解何时使用每个指标的唯一方法是根据您要解决的问题来研究它们。这有点像问“什么是最好的编程语言?”答案是“视情况而定”
  • 我投票结束这个问题,因为它与 help center 中定义的编程无关,而是关于 ML 理论和/或方法 - 请参阅 stackoverflow.com/tags/machine-learning/info 中的介绍和注意事项(适用也在这里)。

标签: python scikit-learn regression scoring


【解决方案1】:

没有最佳评分功能。您选择的应该取决于您的问题以及您要衡量的内容。

我建议您查看您链接的页面的regression metrics section。您可以找到使用说明和建议,例如(针对 MSLE):

该指标最适合用于具有指数增长的目标,例如人口数量、商品在几年内的平均销售额等。

所以,关于这个主题的一个好问题应该是 我正在研究 X 并试图测量 Y,我应该使用哪个评分指标?

【讨论】:

    猜你喜欢
    • 2020-04-09
    • 1970-01-01
    • 2019-03-29
    • 2022-01-20
    • 2019-01-09
    • 2014-07-30
    • 2019-05-03
    • 2020-12-24
    相关资源
    最近更新 更多