本文旨在记录colin老师workshop的exercise1讲解,包含入门级的sklearn操作

 

首先导入库

import numpy as np
import pandas as pd
import scipy.stas as stats
import sklearn

其次导入数据,这里使用的是sklearn中内置的数据集

from sklearn.datasets import load_boston
boston=load_boston()

使用pandas整理数据

[学习记录]sklearn线性回归

pandas可以用来求相关性,取值为-1~1之间,-1为负相关,1为正相关,靠近0则是不相关。其中如果相关性低于0.5则应该考虑换一个参考模型。

[学习记录]sklearn线性回归

 进行线性回归训练

[学习记录]sklearn线性回归

对照测试集进行检验,检验的时候有三个重要指标,三个指标均越小越好

MAE:mean absolute error,预测时发生的平均偏差,取绝对值

MSE:mean squared error,对预测时产生的偏差进行平方处理,导致错误重度惩罚,正确轻度奖励

RMSE:root mean squared error,相当于对MSE结果开平方根

[学习记录]sklearn线性回归

之前介绍的模型是一个自变量一个因变量,也支持多个自变量,就结果来看该模型不如上一个准确

[学习记录]sklearn线性回归

 

相关文章:

  • 2021-12-10
  • 2022-12-23
  • 2021-06-14
  • 2021-06-29
  • 2021-11-22
  • 2021-07-07
  • 2022-12-23
  • 2022-12-23
猜你喜欢
  • 2021-12-21
  • 2021-12-13
  • 2021-12-13
  • 2021-12-18
  • 2022-12-23
相关资源
相似解决方案