神经网络模型设计和理论

现状：单一场景、大量数据、大量算力

大数据+大算力在现阶段起到的作用：

1.更深更复杂的模型提升效果

2.大规模预训练技术和基于向量的表示学习获得广泛应用

2.自动化模型设计成为可能（谷歌5年前提出，AutoML）

一、人工设计模型和预训练大模型

人工设计非线性特征➡️机器自动学习特征（浅层神经网络）

两层神经网络：只要隐藏层足够深

深度模型的优势：用更少的神经元更高效地表示复杂函数，神经元可以进行重用

浅层网络加宽，深层网络深+宽

人工设计深度网络(Resnet)

神经网络模型设计和理论

基于不同的数据，设计不同的网络

神经网络模型设计和理论

从局部到非局部模型：

how to model long range interactions: attention

神经网络模型设计和理论

目前对Bert有很多变种，不做文本生成，做文本理解

GPT是language model，只有从左到右

二、针对特定任务和硬件的自动化模型设计

需要不同大小和算力的模型适用不同硬件设备，如手机、无人驾驶汽车等等，模型要与硬件进行适配。

即自动使用模型在进行适配的工作。

如人工设计小模型案例：mobileNet V3,将模型部署到手机上

神经网络模型设计和理论

机器和人工协作design的模型

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

三、神经网络的优化和过参数化理论简介

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

神经网络模型设计和理论

相关文章：

2021-09-14
2021-10-30
2021-05-19
2022-01-22
2021-12-01
2021-04-30
2021-07-24
2021-04-08

猜你喜欢

2021-11-02
2021-09-04
2021-07-11

相关资源

下载 2023-04-10
下载 2023-01-23
下载 2022-12-27

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode