【阿里云高校计划】一见钟情-视觉AI

【阿里云高校计划】看一次就爱上的视觉

笔记部分

一视觉生产基本概念
1视觉生存的定义：通过一个、一系列视觉过程，产生心的视觉表达
产出：过去是人来产生能够感知的图像，现在希望是由机器人来完成

2视觉生存的分类：
生成，扩展，摘要，升维（维度例如2D到3D），增强，插入合成，擦除

基本框架：
请求（输入）-分发（生产类型）-服务（视觉生产引擎，包括生成引擎和搜索引擎，关键技术）-相应（输出图像、视频）

视觉生产的五个关键维度
1满足视觉、美学表现（可看性
2合乎语义、合乎逻辑（合理性
3保证结果的丰富性（多样性
4提供用户预期的抓手（可控性
5带来商业、用户价值（可用性

二．精细理解：
1识别分类：知道是什么
2检测：知道在哪
3分割：识别+检测知道每个像素是什么
（一）分割抠图-难点：复杂背景，遮挡，发丝精扣，边缘反色等
（二）思路：1复杂文图拆解：粗mask估计+精准matting
2丰富数据样本：设计图像mask统一标准
模型框架：
Step1：mask粗分割 step2：mask质量统一 step3估计精确alpha

分割很复杂、精细，是否能分割动态的？
玻璃中的草怎么分割？背景怎么分割？阴影怎么分割

三．视觉生成：
例如：鹿班、阿里云
框架流程：
得到需求2定草图3.选状态4调整细节5得到结果

视频制作：
素材准备、基础特效、智能特效、智能编排
视频摘要：摘取视频中的重点（然后作为封面）理解内容、满足美学标准、然后还得满足场景

四：视觉编辑
1视频植入：在视频中加如一些原本不存在视频中的东西（插一个内容）
例如广告：广告位检测、广告位跟踪、遮挡检测、素材匹配、光影渲染（内容阴影修饰等
包括动态插入和静态插入

2视频内容擦除
例如文字擦粗，字幕擦除，logo擦除

3画幅变化：
尺寸修改（多了就裁，画面尺寸不够：内容补充

五：视觉增强：修旧如新
例如：视频增强（视频高清化：色彩丰富度、帧率、分辨率等
例如人脸修复
例如：视频插帧
例如：HDR色彩扩展
例如：风格迁移
例如：颜色扩展（颜色搭配合理，多样性，合理性
等很多的应用
六，视觉制造
例如：包装设计、服装设计
核心逻辑：数字服装设计、渲染、制造
例如服装生产：2D版面-3D版面-3D服装-面料-效果-物理模拟
例如材质工艺
例如视觉迁移和融合
例如多样性扩展：风格多样、纹理变换、纹理拼接多样性
例如2D3D相互的转换
例如2D3D融合

最后：
利用阿里云的视觉智能开放平台-专业、实用、全面

观后感：哇~~~俺这个导论真的是太棒了，在报名阿里云的视觉AI训练营之前，我对一视觉生产基本概念
1视觉生存的定义：通过一个、一系列视觉过程，产生心的视觉表达
产出：过去是人来产生能够感知的图像，现在希望是由机器人来完成