环球网@Nvidia研究人员提出用2D图像生成3D对象的渲染框架的方法

外媒报道称 , 计算机很擅长计算3D模型 , 并将之放在2D屏幕上作展示 。 但若要将2D图像逆推成3D模型 , 计算机就有些力不从心了 。 好消息是 , 在机器学习技术的加持下 , 英伟达研究人员已经提出了一种类似的渲染框架 。 其通过AI来获取2D信息 , 并将之准确地转换为3D对象 —— 这套系统被称作DIB-R 。

环球网@Nvidia研究人员提出用2D图像生成3D对象的渲染框架的方法

环球网@Nvidia研究人员提出用2D图像生成3D对象的渲染框架的方法//联盟头条 http://toutiao.caoding.cn/

(题图 viaTechSpot)

DIB-R的全称是“基于可微分插值计算的渲染器” , 底层由PyTorch机器学习框架构建 。 在本周于温哥华举办的年度神经信息处理系统会议上 , 英伟达研究团队介绍了他们的最新进展 。

该框架的工作原理 , 几乎是与GPU的日常工作反过来干 。 它需要分析2D图像 , 然后形成一个高保真的3D对象 , 包括形状、纹理、颜色和照明 。

编解码器的体系结构 , 会从多变球形开始 , 并使用2D图像中给定的信息 , 对其进行变形处理 。 值得一提的是 , 该流程仅需1/10秒 。

若使用单个英伟达V100 GPU进行训练 , 需要对神经网络展开为期2天的训练 。 若使用其它GPU进行训练 , 更需要耗费数周的时间 。

环球网@Nvidia研究人员提出用2D图像生成3D对象的渲染框架的方法

环球网@Nvidia研究人员提出用2D图像生成3D对象的渲染框架的方法//联盟头条 http://toutiao.caoding.cn/

环球网@Nvidia研究人员提出用2D图像生成3D对象的渲染框架的方法。在对其投喂了包含鸟类图片的多个数据集之后 , DIB-R能够在给出单个图像时 , 准确地创建3D模型 。

不过论文合著者Jun Gao表示 , 该系统还可将任何2D图像渲染为3D模型:“实际上 , 这是有史以来的第一次 , 您几乎可以拍摄任何2D图像 , 并预测相关的3D属性” 。

环球网@Nvidia研究人员提出用2D图像生成3D对象的渲染框架的方法。研究人员认为 , 该系统可用于自主式机器人的深度感知应用 , 从而增强其在现实环境中工作时的安全性和准确性 。 通过这样的三维化处理 , 机器人能够更好地导航、以及操纵其需要处理的对象 。

据悉 , 英伟达已将DIB-R添加到其3D深度学习的PyTorch GitHub库中(Kaolin) , 以帮助研究人员加速3D深度学习实验 。

责编:陶宗瑶


    推荐阅读