数据挖掘提分三板斧:

1.金斧-数据清洗和特征工程

2.银斧-模型参数调节

3.铜斧-模型集成

一、关于数据清洗

数据挖掘提分三板斧-转

1.缺失值处理:

数据挖掘提分三板斧-转

 

 2.异常值处理:

数据挖掘提分三板斧-转

 

 3.数据分桶:

数据挖掘提分三板斧-转

 

 

4.数据标准化:在不同的问题中,标准化的意义不同

(1)在回归预测中,标准化是为了让特征值有均等的权重;

(2)在训练神经网络的过程中,通过将数据标准化,能够加速权重参数的收敛;

(3)主成分分析中,需要对数据进行标准化处理;默认指标间权重相等,不考虑指标间差异和相互影响。

数据挖掘提分三板斧-转

二、关于特征工程

 

数据挖掘提分三板斧-转

 

 1.特征构造:

数据挖掘提分三板斧-转

 

 数据挖掘提分三板斧-转

 

 2.特征选择:

数据挖掘提分三板斧-转

 

 

模型参数调节

一、关于建模调参

数据挖掘提分三板斧-转

 

 1.理解模型

数据挖掘提分三板斧-转

 

 2.性能验证

数据挖掘提分三板斧-转

 

 3.模型调参

数据挖掘提分三板斧-转

 

 

模型集成

一、关于模型集成

数据挖掘提分三板斧-转

 

 1.加权融合

数据挖掘提分三板斧-转

 

 2.Boosting/Bagging

数据挖掘提分三板斧-转

 

 3.Stacking/Blending

数据挖掘提分三板斧-转

 

 视频:https://www.bilibili.com/video/BV1MU4y1h75G

文章来自:https://mp.weixin.qq.com/s/41OmNMK1VFKQRuW6D7kqgA

本文只做笔记,不做任何商业用途

 

相关文章:

  • 2021-06-22
  • 2021-12-02
  • 2021-09-07
  • 2021-04-03
  • 2021-12-12
  • 2021-08-13
  • 2021-11-29
猜你喜欢
  • 2021-08-02
  • 2021-08-19
  • 2021-09-16
  • 2021-09-07
  • 2021-05-09
相关资源
相似解决方案