【问题标题】:state-of-the-art of dimensionality algorithms最先进的维数算法
【发布时间】:2011-07-14 03:09:31
【问题描述】:

我们知道有一些算法可以降低数据集的维度,例如 PCA 和 Isomap

  • 什么是最先进的 减少数据集的维度。
  • 您有示例吗,可能在 MATLAB 上?

假设我们有一个包含 100,000 个属性的数据集,例如 Dorothea Data Set (由结构分子特征表示的化学化合物必须分为活性(与凝血酶结合)或非活性。这是 NIPS 2003 特征选择挑战的 5 个数据集之一。)

Data Set Characteristics:   Multivariate

Number of Instances:        1950

Area:                       Life

Attribute Characteristics:  Integer

Number of Attributes:       100000

Date Donated                2008-02-29

Associated Tasks:           Classification

Missing Values?             N/A

Number of Web Hits:         17103

【问题讨论】:

    标签: matlab artificial-intelligence data-mining dimensions


    【解决方案1】:

    特定于Matlab,你可以从他们Statistics Toolbox的手册中获取一些想法。

    查找特征选择和特征转换部分。另外,我会尝试 SVD、FastMap 和 RobustMap。您需要阅读一些关于每一个的内容,然后决定哪一个最适合您的数据。

    【讨论】:

      【解决方案2】:

      最大方差展开是当今特别流行的技术。一种名为 Structure Preserving Embedding 的类似方法在 ICML 2009 上获得了最佳论文。其他一些技术包括 Laplacian Eigenmaps、Locally Linear Embedding 和 Kernel PCA。

      【讨论】:

        猜你喜欢
        • 2011-07-05
        • 2013-11-27
        • 1970-01-01
        • 2016-03-16
        • 2015-04-14
        • 1970-01-01
        • 2020-01-15
        • 1970-01-01
        • 2018-04-13
        相关资源
        最近更新 更多