一、深度学习

1.基本定义

在现在的人工智能领域,数据挖掘类的算法大致可以分为两类,第一种是机器学习算法,第二种是深度学习算法。深度学习算法,可以叫做深度神经网络算法。神经网络的结构可以如下图所示:
深度学习-感知器(感知机)
上图中每个圆圈都是一个神经元,每条线叫神经元的链接
上图中神经元可以分为三层,层与层直接有神经元连接,层内无神经元连接。最左边的层叫输入层。最右边的层叫输出层。输入层和输出层直接的叫隐藏层
深度神经网络:隐藏层大于2的神经网络。

深度网络和宽度网络的区别:
(1)一个仅有一个隐藏层的神经网络就能拟合任何一个函数,但是它需要很多很多的神经元。
(2)而深层网络用少得多的神经元就能拟合同样的函数。也就是为了拟合一个函数,要么使用一个浅而宽的网络,要么使用一个深而窄的网络。而后者往往更节约资源。

二、感知器(也叫感知机)

1.感知器的基本定义

感知器: 也叫感知机,也叫神经元,神经网络的基本组成单元。
感知器的定义:
深度学习-感知器(感知机)
可以看到,一个感知器有如下组成部分:

  • 输入权值: 一个感知器可以接收多个输入(x1,x2,...,xn)(x_1,x_2,...,x_n),每个输入上有一个权值,此外还有一个偏置项bb,就是上图中的w0w_0
  • **函数: 感知器的**函数可以有很多选择,比如我们可以选择下面这个阶跃函数来作为**函数
    f(x)={1z>00otherwisef(x)= \begin{cases} 1& \text{z>0}\\ 0& \text{otherwise} \end{cases}
  • 输出: 感知器的输出由下面的公式来计算
    y=f(wx+b)y =f(w*x +b)
2.感知器的训练

前面的权重项和偏置项的值是如何获得的呢?这就要用到感知器训练算法:将权重项和偏置项初始化为0,然后,利用下面的感知器规则迭代的修改wiw_ibb,直到训练完成。
wi=wi+wiw_i = w_i + \nabla w_i (公式1)
b=b+bb = b+\nabla b (公式2)

其中:
wi=α(ty)xi\nabla w_i = \alpha(t-y)x_i
b=α(ty)\nabla b= \alpha(t-y)

wiw_i是输入xix_i对应的权重项
bb偏置项
tt是训练样本的实际值,也就是label。
yy是感知器的输出值
α\alpha是学习率的常数。

相关文章: