【发布时间】:2015-08-10 17:46:09
【问题描述】:
在癌症的安德鲁斯逻辑回归示例中,我可以画一条水平线 y=.5,(显然通过 y=.5 ),如果有任何点在这条线上方 y=.5 => +ve ,则为十,否则-ve。那么为什么我需要逻辑回归。我只是想了解使用逻辑回归的最佳案例解释?
正如你在图片中看到的那样,一条水平线清楚地划分了两个类别,为什么还要选择逻辑?
【问题讨论】:
-
因为这个数据是线性可分的(可以用直线分开),所以不需要逻辑回归。但是存在非线性可分离问题,需要一条曲线来分离类。非线性可分问题最简单的例子是异或,如果你在异或图中绘制真假,你会发现你不能用一条直线将它们分开,但你需要一条曲线来代替
-
所以首先我们应该绘制我们的训练数据,检查它是否线性可分,然后只要数据是非线性可分的,我们就应该使用逻辑。我们应该这样处理吗?
-
这对于某些数据来说是一种非常好的方法,尽管对于更高维度的数据可能会变得更加困难。但是在选择模型之前绘制不同特征的直方图等来分析数据可以让事情变得更容易。
标签: machine-learning regression logistic-regression