前沿 | NVIDIA PyTorch库让3D深度学习研究更简单！

点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★，与你不见不散

编辑：Sophia
计算机视觉联盟报道 | 公众号 CVLianMeng

转载于：英伟达NVIDIA

推荐文章【点击下面可直接跳转】：

AI博士笔记系列推荐：

目前，3D计算机视觉研究与AI研究都在快速发展，如同两幢摩天大厦，一同拔地而起。然而，在这两座大厦之间却缺少一座连接的桥梁，如要往返于这两座大厦之间，就要爬上爬下几十层楼。

为了解决这一问题，NVIDIA发布推出了Kaolin——它只需几步就能将3D模型导入到神经网络当中。

以PyTorch库形式实现的Kaolin能够简化3D深度学习模型的准备工作，将原来所需的300行代码减少到只需5行。

Kaolin的核心是一套可以操控3D内容的有效几何函数。它可以将以多边形网格、点云、有符号距离函数或体元栅格形式实现的张量3D数据集装入PyTorch。

在准备好用于深度学习的3D数据集后，研究人员可以从Kaolin提供的精选模型集中选择一个神经网络模型。该接口提供了一个丰富的模型存储库，其中包括用于分类、分割、3D重建、超分辨率等的基础模型和先进模型。

部分实际应用

分类：识别3D场景中的物件通常是以下复杂过程的第一步。

3D部件分割：自动识别3D模型的不同部件，使动画角色的骨胳动作绑定或自定义对象变体生成模型变得简单。

图像3D化：根据受过训练的神经网络所识别的产品图像来构建3D模型。也可以使用3D模型在供应商实例目录中反向搜索最适合的3D模型数据库。

除了源代码之外，NVIDIA还将发布符合流行基准、用于此类任务的预训练模型，希望它们可以作为未来研究的基准，从而简化模型对比工作。

Kaolin的模块化设计使用户能够轻松使用3D深度学习中的可微分渲染技术，这是一项热门新技术。用户只需要修改接口耗材组件，无需从头开始编写整个渲染器。

END

声明：本文来源于网络

如有侵权，联系删除

联盟学术交流群

扫码添加联盟小编，可与相关学者研究人员共同交流学习：目前开设有人工智能、机器学习、计算机视觉、自动驾驶（含SLAM）、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群，备注：CV联盟

前沿 | NVIDIA PyTorch库让3D深度学习研究更简单！