中心化
对数据中的每个独立值都减去一个值,使其数据各维度的中心都移到零点

归一化
将所有数据的范围都变为一个区间,使其数值范围都几乎相等。例如把所有数据都映射到-1~1之间。

去相关
把特征之间的相关性降低,数据的协方差矩阵变成对角阵,且中心为0

白化
对去相关后的数据将其方差映射到一个差不多大小的范围,如果本身数据分布是一个多变量的高斯分布,那么白化后的数据是一个均值为0,且协方差相等的矩阵。

数据预处理的几个名词:中心化,归一化,去相关,白化

相关文章:

  • 2021-05-08
  • 2021-05-03
  • 2021-10-26
  • 2022-12-23
  • 2022-01-07
  • 2021-07-29
  • 2022-02-05
  • 2021-12-12
猜你喜欢
  • 2021-08-13
  • 2022-12-23
  • 2022-12-23
  • 2021-10-28
  • 2021-04-06
  • 2021-12-06
  • 2021-07-26
相关资源
相似解决方案