【阿里云高校计划】看一次就爱上的视觉
笔记部分
一视觉生产基本概念
1视觉生存的定义:通过一个、一系列视觉过程,产生心的视觉表达
产出:过去是人来产生能够感知的图像,现在希望是由机器人来完成
2视觉生存的分类:
生成,扩展,摘要,升维(维度例如2D到3D),增强,插入合成,擦除
基本框架:
请求(输入)-分发(生产类型)-服务(视觉生产引擎,包括生成引擎和搜索引擎,关键技术)-相应(输出图像、视频)
视觉生产的五个关键维度
1满足视觉、美学表现(可看性
2合乎语义、合乎逻辑(合理性
3保证结果的丰富性(多样性
4提供用户预期的抓手(可控性
5带来商业、用户价值(可用性
二.精细理解:
1识别分类:知道是什么
2检测:知道在哪
3分割:识别+检测知道每个像素是什么
(一)分割抠图-难点:复杂背景,遮挡,发丝精扣,边缘反色等
(二)思路:1复杂文图拆解:粗mask估计+精准matting
2丰富数据样本:设计图像mask统一标准
模型框架:
Step1:mask粗分割 step2:mask质量统一 step3估计精确alpha
分割很复杂、精细,是否能分割动态的?
玻璃中的草怎么分割?背景怎么分割?阴影怎么分割
三.视觉生成:
例如:鹿班、阿里云
框架流程:
得到需求2定草图3.选状态4调整细节5得到结果
视频制作:
素材准备、基础特效、智能特效、智能编排
视频摘要:摘取视频中的重点(然后作为封面)理解内容、满足美学标准、然后还得满足场景
四:视觉编辑
1视频植入:在视频中加如一些原本不存在视频中的东西(插一个内容)
例如广告:广告位检测、广告位跟踪、遮挡检测、素材匹配、光影渲染(内容阴影修饰等
包括动态插入和静态插入
2视频内容擦除
例如文字擦粗,字幕擦除,logo擦除
3画幅变化:
尺寸修改(多了就裁,画面尺寸不够:内容补充
五:视觉增强:修旧如新
例如:视频增强(视频高清化:色彩丰富度、帧率、分辨率等
例如人脸修复
例如:视频插帧
例如:HDR色彩扩展
例如:风格迁移
例如:颜色扩展(颜色搭配合理,多样性,合理性
等很多的应用
六,视觉制造
例如:包装设计、服装设计
核心逻辑:数字服装设计、渲染、制造
例如服装生产:2D版面-3D版面-3D服装-面料-效果-物理模拟
例如材质工艺
例如视觉迁移和融合
例如多样性扩展:风格多样、纹理变换、纹理拼接多样性
例如2D3D相互的转换
例如2D3D融合
最后:
利用阿里云的视觉智能开放平台-专业、实用、全面
观后感:哇~~~俺这个导论真的是太棒了,在报名阿里云的视觉AI训练营之前,我对一视觉生产基本概念
1视觉生存的定义:通过一个、一系列视觉过程,产生心的视觉表达
产出:过去是人来产生能够感知的图像,现在希望是由机器人来完成
2视觉生存的分类:
生成,扩展,摘要,升维(维度例如2D到3D),增强,插入合成,擦除
基本框架:
请求(输入)-分发(生产类型)-服务(视觉生产引擎,包括生成引擎和搜索引擎,关键技术)-相应(输出图像、视频)
视觉生产的五个关键维度
1满足视觉、美学表现(可看性
2合乎语义、合乎逻辑(合理性
3保证结果的丰富性(多样性
4提供用户预期的抓手(可控性
5带来商业、用户价值(可用性
二.精细理解:
1识别分类:知道是什么
2检测:知道在哪
3分割:识别+检测知道每个像素是什么
(一)分割抠图-难点:复杂背景,遮挡,发丝精扣,边缘反色等
(二)思路:1复杂文图拆解:粗mask估计+精准matting
2丰富数据样本:设计图像mask统一标准
模型框架:
Step1:mask粗分割 step2:mask质量统一 step3估计精确alpha
分割很复杂、精细,是否能分割动态的?
玻璃中的草怎么分割?背景怎么分割?阴影怎么分割
三.视觉生成:
例如:鹿班、阿里云
框架流程:
得到需求2定草图3.选状态4调整细节5得到结果
视频制作:
素材准备、基础特效、智能特效、智能编排
视频摘要:摘取视频中的重点(然后作为封面)理解内容、满足美学标准、然后还得满足场景
四:视觉编辑
1视频植入:在视频中加如一些原本不存在视频中的东西(插一个内容)
例如广告:广告位检测、广告位跟踪、遮挡检测、素材匹配、光影渲染(内容阴影修饰等
包括动态插入和静态插入
2视频内容擦除
例如文字擦粗,字幕擦除,logo擦除
3画幅变化:
尺寸修改(多了就裁,画面尺寸不够:内容补充
五:视觉增强:修旧如新
例如:视频增强(视频高清化:色彩丰富度、帧率、分辨率等
例如人脸修复
例如:视频插帧
例如:HDR色彩扩展
例如:风格迁移
例如:颜色扩展(颜色搭配合理,多样性,合理性
等很多的应用
六,视觉制造
例如:包装设计、服装设计
核心逻辑:数字服装设计、渲染、制造
例如服装生产:2D版面-3D版面-3D服装-面料-效果-物理模拟
例如材质工艺
例如视觉迁移和融合
例如多样性扩展:风格多样、纹理变换、纹理拼接多样性
例如2D3D相互的转换
例如2D3D融合
最后:
利用阿里云的视觉智能开放平台-专业、实用、全面
感想
观后感:哇~~~俺这个导论真的是太棒了,在报名阿里云的视觉AI训练营之前,我对视AI的了解只有图像识别,就是给一个图然后去识别这个图中的各个元素,看过这个导论后,我惊奇的发现原来视觉AI技术已经渗透到了我们生活的方方面面,从个人照片修图到广告再到购物再到工业生产。视觉AI好强好有趣,这个世界上是这么多技术点点滴滴支撑起来的。俺得好好学习哈哈哈哈哈。这坚定了俺学AI的想法,加油奥里给!冲冲冲!