1. Entropy-Based Discretization 基于熵的离散化

连续特征离散化

用熵对连续数据进行离散化,其基本思想是利用熵的大小来表示划分后数据集的纯度,熵越小,数据纯度越大,得到的离散数据可用性就更高

具体做法是:先把数据集划分为两部分,计算两部分的熵的和,在熵最小的地方划分,然后对熵最大的那部分重复此步骤,直到满足用户需要的数据集个数

相关文章:

  • 2022-12-23
  • 2021-06-16
  • 2021-12-06
  • 2021-05-20
  • 2022-12-23
  • 2021-10-11
  • 2021-04-12
  • 2021-09-23
猜你喜欢
  • 2022-01-11
  • 2021-05-22
  • 2021-11-24
  • 2022-01-16
  • 2021-04-22
  • 2021-09-17
  • 2021-07-01
相关资源
相似解决方案