点上方蓝字计算机视觉联盟获取更多干货
在右上方 ··· 设为星标 ★,与你不见不散
计算机视觉联盟 报道 | 公众号 CVLianMeng
AI博士笔记系列推荐:
目前,3D计算机视觉研究与AI研究都在快速发展,如同两幢摩天大厦,一同拔地而起。然而,在这两座大厦之间却缺少一座连接的桥梁,如要往返于这两座大厦之间,就要爬上爬下几十层楼。
为了解决这一问题,NVIDIA发布推出了Kaolin——它只需几步就能将3D模型导入到神经网络当中。
以PyTorch库形式实现的Kaolin能够简化3D深度学习模型的准备工作,将原来所需的300行代码减少到只需5行。
Kaolin的核心是一套可以操控3D内容的有效几何函数。它可以将以多边形网格、点云、有符号距离函数或体元栅格形式实现的张量3D数据集装入PyTorch。
在准备好用于深度学习的3D数据集后,研究人员可以从Kaolin提供的精选模型集中选择一个神经网络模型。该接口提供了一个丰富的模型存储库,其中包括用于分类、分割、3D重建、超分辨率等的基础模型和先进模型。
部分实际应用
分类:识别3D场景中的物件通常是以下复杂过程的第一步。
3D部件分割:自动识别3D模型的不同部件,使动画角色的骨胳动作绑定或自定义对象变体生成模型变得简单。
图像3D化:根据受过训练的神经网络所识别的产品图像来构建3D模型。也可以使用3D模型在供应商实例目录中反向搜索最适合的3D模型数据库。
除了源代码之外,NVIDIA还将发布符合流行基准、用于此类任务的预训练模型,希望它们可以作为未来研究的基准,从而简化模型对比工作。
Kaolin的模块化设计使用户能够轻松使用3D深度学习中的可微分渲染技术,这是一项热门新技术。用户只需要修改接口耗材组件,无需从头开始编写整个渲染器。
END
声明:本文来源于网络
如有侵权,联系删除
扫码添加联盟小编,可与相关学者研究人员共同交流学习:目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟
最新热文荐读
点个在看支持一下吧