Swish

paper:https://arxiv.org/abs/1710.05941

beta是个常数或者可以训练的参数。其具有无上界有下界、平滑、非单调的特性。其在模型效果上优于ReLU。

relu 里面的是**函数

relu 里面的是**函数

relu 里面的是**函数

当β = 0时,Swish变为线性函数f(x)=x2f(x)=x2.
β → ∞, σ(x)=(1+exp(−x))−1σ(x)=(1+exp⁡(−x))−1为0或1. Swish变为ReLU: f(x)=2max(0,x)
所以Swish函数可以看做是介于线性函数与ReLU函数之间的平滑函数.

Sigmoid函数:

relu 里面的是**函数

relu 里面的是**函数

relu 里面的是**函数

relu 里面的是**函数

 

相关文章:

  • 2022-01-03
  • 2021-06-15
  • 2021-09-23
  • 2021-12-02
  • 2021-07-19
  • 2021-06-21
  • 2021-06-11
  • 2021-10-21
猜你喜欢
  • 2021-09-27
  • 2021-10-17
  • 2022-12-23
  • 2021-07-31
  • 2021-11-18
相关资源
相似解决方案