【问题标题】:Is it required to add columns of ones to training data for Multivariate Linear Regression in scikit?是否需要在 scikit 中为多元线性回归的训练数据添加一列?
【发布时间】:2018-02-15 02:45:38
【问题描述】:

我一直在网上浏览各种 MOOC,其中一个提到要在 scikit 中线性回归的训练数据中包含一列。

假设我有以下训练数据集:

investment    loan
    300000   12000
    431000    3000
    900000    4000
    320000    2000

在适合 Python 中 LinearRegression 的 scikit 模型之前,我是否需要添加如下列?

ones    investment    loan
   1        300000   12000
   1        431000    3000
   1        900000    4000
   1        320000    2000

感谢任何帮助。

【问题讨论】:

  • 您应该尝试了解它在做什么(尤其是在您处理课程时)。它可以处理偏差/居中。现在去 sklearn 的文档看看这个偏差支持是否是一个参数。
  • @sascha 我已经浏览了所有相关文档,在我看来,我无法在任何文档中找到关于此主题的任何内容。

标签: python machine-learning scikit-learn linear-regression


【解决方案1】:

来自docs

fit_intercept : 布尔值,可选,默认 True

是否计算此模型的截距。如果设置为 False,则不 截距将用于计算(例如,数据预计为 已经居中)。

截距 是与“1 列”相关的系数。因此,如果此参数设置为True(这是默认值),则不需要您的 1 列。

【讨论】:

  • 啊,是的!实际上。不错的收获。谢谢@eqperes
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2016-11-26
  • 1970-01-01
  • 2013-04-14
  • 2023-03-25
  • 2016-10-23
  • 1970-01-01
  • 2020-08-08
相关资源
最近更新 更多