【问题标题】:Which machine learning model is applicable to the following case哪种机器学习模型适用于以下情况
【发布时间】:2015-06-29 16:45:10
【问题描述】:

我想建立一个基于多个指标识别物种的模型。问题是,神经网络(通常)接收向量,而我的指标并不总是很容易用数字表示。例如,指标之一不仅是物种是否执行某些动作(例如,“0”或“1”,或介于两者之间的任何动作,如果动作的本质允许的话),但有时,以何种顺序是执行的那些动作。我希望系统能够根据这些指标来决定和分类物种。没有可能的类,而是有许多指标。 训练数据的数量不是问题,我可以得到尽可能多的数据。 我应该考虑哪些机器学习技术?也许某种特殊的神经网络会做?或者可能是完全不同的东西。

【问题讨论】:

  • 你可能想看看内核和 MKL
  • 您能详细说明一下吗?
  • 很遗憾,暂时没有,抱歉。有时间我会试试的
  • 如果您可以将输入标准化为某种形式的向量 - 任何分类机器(我忘记了 Bayes/NN/kernels/svm 的东西?)都可以。

标签: machine-learning neural-network classification


【解决方案1】:

如果您将一系列操作视为字符串,则使用“执行了操作 A”之类的功能类似于 unigram model。如果你想考虑动作的顺序,你应该添加二元组、三元组等。

不过,这会炸毁您的功能空间。例如,如果您有M 可能的操作,那么就有M (M-1) / 2 二元组。一般来说,有@987654322@(M<sup>k</sup>)k-grams。这会导致以下问题:

  • 您拥有的功能越多,应用某些方法就越困难。例如,许多模型遭受curse of dimensionality
  • 您拥有的功能越多 - 捕获有意义的关系所需的数据就越多。

这只是解决您的问题的一种可能方法。可能还有其他人。例如,如果您知道有一组参数 ϴ 以已知(至少近似)方式控制动作生成过程,您可以构建一个单独的模型来首先推断这些参数,然后使用 ϴ 作为特征。

为您的数据提出合理的数字表示的过程称为feature engineering。完成此操作后,您可以随意使用任何机器学习算法。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2013-02-06
    • 2018-09-22
    • 2012-12-06
    • 2017-10-29
    • 2016-02-24
    • 2012-06-08
    • 2019-07-17
    • 1970-01-01
    相关资源
    最近更新 更多