【问题标题】:Does any H2O algorithm support multi-label classification?是否有任何 H2O 算法支持多标签分类?
【发布时间】:2019-05-10 05:38:41
【问题描述】:

深度学习模型是否支持多标签分类问题或H2O中的任何其他算法?

Orginal Response Variable -Tags:

apps, email, mail
finance,freelancers,contractors,zen99
genomes
gogovan
brazil,china,cloudflare
hauling,service,moving
ferguson,crowdfunding,beacon
cms,naytev
y,combinator
in,store,
conversion,logic,ad,attribution

将它们映射到字典的键后: 那么

响应变量如下所示:

[74]
[156, 89]
[153, 13, 133, 40]
[150]
[474, 277, 113]
[181, 117]
[15, 87, 8, 11]

谢谢

【问题讨论】:

  • 如果你能说出这些数字代表什么,如果数组中的顺序很重要等等,那就太好了。即你正在尝试预测什么。目前这个问题确实没有比你的其他问题更多的信息:stackoverflow.com/q/53684039/841830
  • @DarrenCook 更新

标签: deep-learning h2o multilabel-classification


【解决方案1】:

任何创建模型的算法都为一组输入提供“finance,freelancers,contractors,zen99”,为另一组输入提供“cms,naytev”,这严重地过度拟合。您需要退后一步,想想您的实际问题是什么。

但取而代之的是,这里有一个想法:在您的答案词上训练一些词嵌入(或使用一些预训练的词嵌入)。然后,您可以对每组值的向量进行平均,并希望这可以为您提供“主题”的良好数字表示。然后,您需要将您的 100 维平均词向量转换为单个数字(想到 PCA)。现在你有一个数字,你可以给机器学习算法,它可以预测。

你仍然有一个问题:预测了一个数字,你如何把这个数字变成一个 100 维向量,然后从那里变成一个主题,再从那里变成主题词?棘手,但也许并非不可能。

(顺便说一句,如果您将上述“单个数字”转换为一个因素,并让机器学习模型进行分类,以预测与以前见过的最相似的主题......你基本上已经绕了一圈,将得到一个与the one you started with that has too many classes 相同的模型。)

【讨论】:

  • 是的,这是一个选项,但我想通过深度学习尝试这个选项,我正在使用 word2vec 进行嵌入。
【解决方案2】:

不,H2O 仅包含学习一次预测单个响应变量的算法。您可以将每个独特的组合转换为单个类并以这种方式培训多级模型,或者通过单独的模型预测每个类。

【讨论】:

  • 谢谢,在任何其他平台可用?
  • 是否可以将组合概率映射到每个类的单独概率?关于多书分类,在我看来,这是相当普遍的,这让我感到惊讶的是,H2O不支持它... span>
猜你喜欢
  • 2020-08-28
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2015-10-02
  • 2011-08-07
  • 2013-05-07
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多