OpenAI 推出 Shap・E：基于文本数秒内生成高质量 3D 模型-51CTO.COM

5 月 9 日消息，继文本生成图片模型 DALL・E 之后，OpenAI 近日再次发布了 Shap・E 模型。用户可以输入文本，用于创建逼真且多样化的 3D 模型。

Shap・E 并不仅仅只是一个 3D 模型生成器，而且可以直接生成隐式函数（implicit functions）的参数，而这些参数可以渲染纹理网格（textured meshes）和神经辐射场（NeRF）。

这意味着 Shap・E 和当前仅输出点云（point clouds）或体素（voxels）的模型不同，可以生成具有细粒度纹理和复杂形状的高质量 3D 资产。

OpenAI 展示了 Shap・E 的结果，例如一碗食物，一只企鹅，一只体素化的狗，一个篝火，一把鳄梨形的椅子等。整个图片可以在几秒内完成渲染。

附相关名词解释如下：

神经辐射场（Neural Radiance Field, NeRF）作为一种具有隐式场景表示的新型视场合成技术，在计算机视觉领域引起了广泛的关注。

作为一种新颖的视图合成和三维重建方法，NeRF 模型在机器人、城市地图、自主导航、虚拟现实 / 增强现实等领域都有广泛的应用。

云点是一系列落在三维坐标系统里的点，他们可以在建筑表面或建筑外立面展开，以捕捉建筑外观的形态。

体素是 3D 空间的像素。量化的，大小固定的点云。每个单元都是固定大小和离散坐标。