5 月 9 日消息,继文本生成图片模型 DALL・E 之后,OpenAI 近日再次发布了 Shap・E 模型。用户可以输入文本,用于创建逼真且多样化的 3D 模型。
Shap・E 并不仅仅只是一个 3D 模型生成器,而且可以直接生成隐式函数(implicit functions)的参数,而这些参数可以渲染纹理网格(textured meshes)和神经辐射场(NeRF)。
这意味着 Shap・E 和当前仅输出点云(point clouds)或体素(voxels)的模型不同,可以生成具有细粒度纹理和复杂形状的高质量 3D 资产。
OpenAI 展示了 Shap・E 的结果,例如一碗食物,一只企鹅,一只体素化的狗,一个篝火,一把鳄梨形的椅子等。整个图片可以在几秒内完成渲染。
附相关名词解释如下:
神经辐射场(NeRF):
神经辐射场(Neural Radiance Field, NeRF)作为一种具有隐式场景表示的新型视场合成技术,在计算机视觉领域引起了广泛的关注。
作为一种新颖的视图合成和三维重建方法,NeRF 模型在机器人、城市地图、自主导航、虚拟现实 / 增强现实等领域都有广泛的应用。
点云(point clouds):
云点是一系列落在三维坐标系统里的点,他们可以在建筑表面或建筑外立面展开,以捕捉建筑外观的形态。
体素(voxels)
体素是 3D 空间的像素。量化的,大小固定的点云。每个单元都是固定大小和离散坐标。