腾讯、上海科大开源InstantMesh，图片直接生成3D模型

Aceryt

发布于 2024-5-9 09:58

浏览

0收藏

腾讯PCG ARC实验室和上海科技大学的研究人员联合开源了创新模型——InstantMesh。

用户通过InstantMesh上传一张图片，只需要十秒的时间就能将图片变成360度全视角的3D模型。并且可以下载模型将其放在3D Max、玛雅等专业软件中，以简化游戏、广告、家居、虚拟现实等开发流程。

研究人员在公开数据集Google Scanned Objects、OmniObject3D等InstantMesh进行了综合测试。

结果显示，其生成的3D模型在视觉质量和几何精度上都显著优于现有最新方法,如LGM、CRM等。在多视角的合成任务上,InstantMesh也明显优于SV3D等知名扩散模型。

开源地址：https://github.com/TencentARC/InstantMesh

在线demo：https://huggingface.co/spaces/TencentARC/InstantMesh

论文地址：https://arxiv.org/abs/2404.07191

腾讯、上海科大开源InstantMesh，图片直接生成3D模型-AI.x社区

InstantMesh的技术创新在于，将多视图扩散模型和稀疏视图重建模型相结合使用。

首先利用多视角扩散模型生成一组一致的多视角图像，然后利用稀疏视图重建模型直接预测3D网格，整个过程只需要十几秒甚至几秒就能完成。

为了提高训练效率，并在3D网格表示上应用几何监督信息，InstantMesh还引入了一个可微分的等值面提取模块。这种方法能够直接在网格表面上进行优化，从而提高训练效率和模型生成的质量。

多视图扩散模型

多视图扩散模型的主要作用是将一张静态的2D图片中生成一系列新的视角图像，这些图像覆盖了目标物体的多个方向。

首先，接收用户输入的图片，并利用Zero123++模型生成一系列的新视角图像，包括了物体的正面、侧面、上面、下面和背面等360度视角图片。

这可以帮助InstantMesh捕捉到图片的全方位信息，为后续的3D网格预测打下坚实的基础。

腾讯、上海科大开源InstantMesh，图片直接生成3D模型-AI.x社区

简单来说，整个过程就像玩拼图游戏一样，例如，需要从一张完整的图片中找到所有可能的视角，然后将它们拼凑起来，形成一个完整的立体图像。

所以，也可以把多视图扩散模型理解成InstantMesh的“眼睛”，帮助它深度剖析每一张上传的图片。

稀疏视图重建模型

稀疏视图重建模型则主要负责将，多视图扩散模型生成的视图拼装成3D模型。首先通过其内部的神经网络架构，提取输入图像的特征，并将其与先前的知识结合起来，以便更好地理解物体的结构和外观。

腾讯、上海科大开源InstantMesh，图片直接生成3D模型-AI.x社区

利用提取到的特征和辅助知识，稀疏视图重建模型能预测出一个初步的3D网格模型，包含了物体的基本形状和结构，但是在质量和细节方面还差很多。

所以，研究人员使用了可微分的等值面提取模块对网格表面进行几何监督，大幅度优化3D模型的细节和平滑度。

腾讯、上海科大开源InstantMesh，图片直接生成3D模型-AI.x社区

此外，这种直接在网格表面进行监督训练的优化方法，避免了体素渲染的高计算消耗,同时能利用全分辨率的RGB图像、深度图和法线图作为训练监督,也使得生成的3D模型更加适合于后续的渲染、编辑和分析等应用。

本文转自 AIGC开放社区，作者：AIGC开放社区

原文链接:https://mp.weixin.qq.com/s/PtKWx6mWvWDH95ifa946dw

标签

3D模型

开源

相关推荐

文本直接生成2分钟视频，即将开源模型StreamingT2V

Aceryt • 3911浏览 • 0回复
文本直接生成多视角3D图像，Meta推出创新模型

Aceryt • 2053浏览 • 0回复
TELA: 最先进文本描述生成3D穿衣人体方案！支持虚拟试衣，上海AI Lab&网易等联合发布

angel • 4748浏览 • 0回复
无需3D数据也能训练，港科&港中文联手华为推出3D自动驾驶场景生成模型

Crystalcxt • 2509浏览 • 0回复
5秒完成3D生成，真香合成数据集已开源，上交港中文新框架超越Instant3D

Crystalcxt • 2339浏览 • 0回复
上科大、影眸联合提出DressCode：从文本生成3D服装板片

轻薄滴假象 • 2965浏览 • 0回复
DreamTech联合南大和牛津发布最强3D内容生成大模型——Direct3D

angel • 2610浏览 • 0回复
仅需1分钟，文本生成高质量3D模型—Meta 3D-Gen

Aceryt • 2737浏览 • 0回复
3D版"裁缝"开源来袭！Tailor3D:自定义3D编辑和资产生成（港大&上海AI-Lab&港中文）

angel • 2196浏览 • 0回复
Stability.ai开源3D模型，仅需0.5秒就能快速生成

Aceryt • 2678浏览 • 0回复
随意画个草图就能生成3D交互游戏场景！腾讯XR出品

angel • 3046浏览 • 0回复
3D人体重建新SOTA！清华&腾讯等重磅发布MagicMan：单一图像生成高质量人体新突破

angel • 2635浏览 • 0回复
精准可控新视角视频生成+场景级3D生成！北大&港中文&腾讯等开源ViewCrafter

angel • 2240浏览 • 0回复
麻省理工创新模型：用2D视频扩散，生成 3D 视频

Aceryt • 2478浏览 • 0回复
3D生成基础模型来了！只需5秒，高质量3D资产规模化生成！南洋理工等重磅开源3DTopia-XL

angel • 2116浏览 • 0回复
生成任意3D和4D场景！GenXD：通用3D-4D联合生成框架 | 新加坡国立&微软

angel • 1790浏览 • 0回复
只需一张图片！实现任意3D/4D场景生成！港科大&清华&生数发布DimensionX

angel • 3654浏览 • 0回复
革新3D材质生成！Material Anything：端到端打造任意3D物体的高质量材质！

angel • 2197浏览 • 0回复
首篇2D/视频/3D/4D统一生成框架全景综述(港科大&中山等)

angel • 1237浏览 • 0回复

angel

LV.9

这个用户很懒，还没有个人简介

觉得TA不错？点个关注精彩不错过

325

帖子

3027

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

腾讯、上海科大开源InstantMesh，图片直接生成3D模型