Facebook Inc.的研究部门周四发布了PyTorch3D的代码,PyTorch3D是一种自产的工具包,旨在简化可在三维环境中运行的人工智能模型的开发。

在或至少了解3D空间的能力对于跨多个领域的深度学习应用至关重要。最明显的领域是机器人技术,虚拟现实和增强现实。即使是分析对象二维照片的传统图像识别模型,也可以从了解对象的真实三维形式中受益,因为额外的上下文可能有助于提高其准确性。

但是,由于Facebook说缺乏专用开发工具,因此在释放3D深度学习优势方面的进展相对缓慢。借助PyTorch3D,社交网络的研究人员正在寻求解决差距并降低学习曲线,以在应用程序中实施该技术。

PyTorch3D的第一个组件是称为网格的数据结构。数字3D模型由所谓的网格组成,这些网格具有多种不同的类型,可能很难使用。Meshes结构提供了用于组织这些形状的统一格式,Facebook表示,这使AI开发人员更轻松地处理其数据。

开发人员可以使用Facebook包含在PyTorch3D中的一组损失函数和运算符来构建AI模型来处理其3D模型。损失函数是用于跟踪AI在数据集上进行训练时所犯错误的算法,该信息有助于引导学习过程朝正确的方向发展。操作员本质上是在编写用于执行复杂任务的快捷方式,在这种情况下,涉及3D对象的计算。

Facebook研究人员Nikhila Ravi,Georgia Gkioxari和Justin Johnson在博客中写道:“我们已经完成了优化3D数据的几种常见运算符和损失函数的实现的工作,从而支持了不同批次的输入。”“随着时间的推移,我们将继续增加一组通用运算符。”

Facebook已通过渲染引擎增强了PyTorch3D的功能集,该引擎将3D数据转换为2D图像,开发人员可以查看或应用程序对其进行处理。渲染器不仅可以生成对象,还可以添加照明和阴影效果。它具有一个应用程序编程接口,该接口允许将项目导出到流行的深度学习框架中,例如Facebook开发的PyTorch(该工具包的同名产品)。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。