【发布时间】:2019-08-16 05:29:54
【问题描述】:
我正在使用 h2o.deeplearning 在分类任务上训练神经网络。
我有什么
Y ~ x1 + x2... 其中所有 x 变量都是连续的,Y 是二进制的。
我想要什么
能够训练深度学习对象来预测给定行是真还是假的概率。也就是说,预测值 (Y) 限制在 0 和 1 之间。
我尝试过的 当 Y 输入为数字(即 0 或 1)时,h2o 深度学习会自动将其视为回归问题。这很好,除了 NN 的最后一层是线性的,而不是 tanh,并且预测值可以大于 1 或小于 0。我一直无法找到让最后一层成为 tanh 的方法.
当 Y 输入为分类问题(即 TRUE 或 FALSE)时,h2o 深度学习会自动将其视为分类问题。它没有给出 Y 为 1 或 0 的期望概率,而是给出了 Y 是什么的最佳猜测。
有没有办法解决这个问题?技巧、调整或被忽视的参数?我在 h2o.deeplearning 文档中注意到一个“分布”参数,但没有关于它的用途的更多信息。我最好的猜测是它是某种与 GLM 相同的链接功能,但我不确定。
【问题讨论】:
-
好吧,你还没有提供任何代码。你没有提供任何数据。而且您还没有提供任何指向您已经研究过其文档的网站的链接,因此我们不知道您为此付出了多少努力。我想知道这是否更接近 stackexchange 的 beta 数据科学部分处理的主题? (别怪我,它们不是我的选票,所以这些只是对动机的猜测。)
标签: r regression classification h2o