【问题标题】:Data normalization for K-Means algorithmK-Means 算法的数据归一化
【发布时间】:2015-12-18 23:46:18
【问题描述】:

我想使用 K-Means 算法对我的数据进行聚类,我的数据应该被标准化我不知道哪种标准化方法更适合这个算法? (min-max or z-transformation or decimal or...)rapid miner normalized data with z-transformation method 但是我如何使用 rapid miner 实现 min-max 标准化?或者哪种工具和方法更适合标准化数据?我应该检查我的数据是否需要标准化?怎么样?

【问题讨论】:

    标签: cluster-analysis normalization k-means


    【解决方案1】:

    正确的标准化方式取决于您的数据

    根据经验:

    1. 如果所有坐标轴都测量相同的东西,归一化可能是有害的
    2. 如果轴有不同的单位和非常不同的比例,那么标准化是绝对必要的(否则,您是在比较苹果和橙子)。
    3. 如果您知道或假设某些属性比其他属性更重要,请考虑手动加权属性。

    至于 min-max 或 z-transformation:这取决于数据的分布。 如果您有异常值,则 min-max 无法正常工作

    【讨论】:

      猜你喜欢
      • 2013-07-03
      • 2010-12-05
      • 2017-04-20
      • 2013-04-22
      • 2011-09-15
      • 2015-08-16
      • 2017-04-27
      相关资源
      最近更新 更多