R h2o.deeplearning 用分类模式获取概率答案

【问题标题】：R h2o.deeplearning obtaining probabilities with classification modeR h2o.deeplearning 用分类模式获取概率
【发布时间】：2019-08-16 05:29:54
【问题描述】：

我正在使用 h2o.deeplearning 在分类任务上训练神经网络。

我有什么

Y ~ x1 + x2... 其中所有 x 变量都是连续的，Y 是二进制的。

我想要什么

能够训练深度学习对象来预测给定行是真还是假的概率。也就是说，预测值 (Y) 限制在 0 和 1 之间。

我尝试过的 当 Y 输入为数字（即 0 或 1）时，h2o 深度学习会自动将其视为回归问题。这很好，除了 NN 的最后一层是线性的，而不是 tanh，并且预测值可以大于 1 或小于 0。我一直无法找到让最后一层成为 tanh 的方法.

当 Y 输入为分类问题（即 TRUE 或 FALSE）时，h2o 深度学习会自动将其视为分类问题。它没有给出 Y 为 1 或 0 的期望概率，而是给出了 Y 是什么的最佳猜测。

有没有办法解决这个问题？技巧、调整或被忽视的参数？我在 h2o.deeplearning 文档中注意到一个“分布”参数，但没有关于它的用途的更多信息。我最好的猜测是它是某种与 GLM 相同的链接功能，但我不确定。

【问题讨论】：

好吧，你还没有提供任何代码。你没有提供任何数据。而且您还没有提供任何指向您已经研究过其文档的网站的链接，因此我们不知道您为此付出了多少努力。我想知道这是否更接近 stackexchange 的 beta 数据科学部分处理的主题？（别怪我，它们不是我的选票，所以这些只是对动机的猜测。）

【解决方案1】：

如果您将问题视为二元分类问题，那么您不仅会得到 0 或 1 的“预测”，而且还会得到 p0 和 p1 的概率加起来为 1。这些是预测值为分别为负类和正类。

那直接用p1就好了。

【讨论】：