现状:单一场景、 大量数据、大量算力

大数据+大算力在现阶段起到的作用

1.更深更复杂的模型提升效果

2.大规模预训练技术和基于向量的表示学习获得广泛应用

2.自动化模型设计成为可能(谷歌5年前提出,AutoML

一、人工设计模型和预训练大模型

人工设计非线性特征➡️机器自动学习特征(浅层神经网络)

两层神经网络:只要隐藏层足够深

深度模型的优势:用更少的神经元更高效地表示复杂函数,神经元可以进行重用

浅层网络加宽,深层网络深+宽

人工设计深度网络(Resnet)

神经网络模型设计和理论

基于不同的数据,设计不同的网络

神经网络模型设计和理论

从局部到非局部模型:

how to model long range interactions: attention

 

神经网络模型设计和理论

目前对Bert有很多变种,不做文本生成,做文本理解

GPT是language model,只有从左到右

二、针对特定任务和硬件的自动化模型设计

需要不同大小和算力的模型适用不同硬件设备,如手机、无人驾驶汽车等等,模型要与硬件进行适配。

即自动使用模型在进行适配的工作。

如人工设计小模型案例:mobileNet V3,将模型部署到手机上

神经网络模型设计和理论

机器和人工协作design的模型

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

三、神经网络的优化和过参数化理论简介

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

相关文章:

  • 2021-09-14
  • 2021-10-30
  • 2021-05-19
  • 2022-01-22
  • 2021-12-01
  • 2021-04-30
  • 2021-07-24
  • 2021-04-08
猜你喜欢
  • 2021-11-02
  • 2021-09-04
  • 2021-07-11
相关资源
相似解决方案