鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

仅需1分钟，文本生成高质量3D模型—Meta 3D-Gen 精华

发布于 2024-7-5 10:14

浏览

0收藏

全球社交、科技巨头Meta发布了全新文生3D模型——Meta 3D-Gen。

用户通过Meta 3D-Gen仅需1分钟就能生成人物、动物、道具、服饰、工业设计等不同类型的高质量3D模型。

Meta 3D-Gen不仅生成的内容是高分辨率的纹理和材质贴图，还支持物理渲染光影效果非常好，适用于游戏开发、电影制作、虚拟现实、建筑设计等领域，帮助开发人员节省大量时间。

仅需1分钟，文本生成高质量3D模型—Meta 3D-Gen-AI.x社区

仅需1分钟，文本生成高质量3D模型—Meta 3D-Gen-AI.x社区

多视图到3D重建

多视图到3D重建是Meta 3D-Gen的两大核心模块之一，主要将用户输入的文本提示转换为3D空间中的具体形态，包括形状、结构、材质、纹理等。例如，“一只穿着绿色羊毛毛衣的暴龙”，需要根据文本中的绿色、毛衣、暴龙等元素解析出对应的建模。

首先，Meta使用了自研的一个多视图和多通道版本的文本到图像生成模型Emu，来生成一系列相对一致的物体视角图像。该过程就像是通过不同角度拍摄同一物体的照片，为后续的3D模型重建提供了多视角的视觉信息。

仅需1分钟，文本生成高质量3D模型—Meta 3D-Gen-AI.x社区

Emu模型经过精心微调，使用了合成3D数据的渲染图像，以便在视图空间中进行多视图生成，同时也在UV空间中进行生成，从而产生更优质的纹理。

然后，从这些多视角图像中提取出3D物体的初步版本，将其转换为体积空间中的表示。这是通过从多个角度的图像中重建3D形状的过程，类似于从多个快照中拼接出一个立体模型。

重建后的3D模型不仅包含了物体的形状，还附带了初步的纹理和物理渲染材质贴图，这对于在真实世界中应用非常有帮助。

仅需1分钟，文本生成高质量3D模型—Meta 3D-Gen-AI.x社区

为了更精准地获取3D形状，Meta 3D-Gen还使用了基于有符号距离场的优化表示法，这是一种用于描述3D形状的方法，可以计算出物体表面相对于某点的距离，对于保持形状的细节和精确性非常有效，能够在保证3D模型结构完整性和细节丰富性的同时，也确保了模型的拓扑质量。

3D纹理细化

在第一阶段获取精准的3D模型之后，就需要借助3D纹理生成进一步细化、增强3D模型效果。

纹理细化是基于初始的3D模型和用户提供的文本描述，生成一系列物体的多视图图像。这些图像不仅仅是简单的渲染，还包含了物体的光照外观以及其固有色，也就是在没有外部光源影响下的物体基本颜色。

仅需1分钟，文本生成高质量3D模型—Meta 3D-Gen-AI.x社区

在优化的过程中，Meta 3D-Gen通过一个神经网络可将多个视角下的信息进行融合，生成一个在视觉上连贯且一致的纹理。为了增强纹理的效果，Meta 3D-Gen还内置了优化增强神经网络，输入的视图重新投影到纹理空间，生成2K、4K或更清晰的纹理细节。

为了测试该模型的性能，研究人员将Meta 3D-Gen与CSM Cube 2.0、Tripo3D、Rodin Gen-1 V0.5和Meshy v3知名文本生成3D模型进行了综合对比。

仅需1分钟，文本生成高质量3D模型—Meta 3D-Gen-AI.x社区

结果显示，Meta 3D-Gen在文本语义还原、视觉质量和纹理、生成效率等关键评测指标上超越了这些模型。尤其是Meta 3D-Gen的生成效率非常高，比现有模型快3—60倍左右。

本文转自 AIGC开放社区，作者：AIGC开放社区

原文链接:https://mp.weixin.qq.com/s/jzwpdSo6xUrSSgCzHFROBw

标签

赞

收藏

回复

举报

回复

相关推荐

CVPR 2024 | 仅需文本或图像提示，新框架CustomNeRF精准编辑3D场景

轻薄滴假象 • 789浏览 • 0回复
文本直接生成多视角3D图像，Meta推出创新模型

Aceryt • 1117浏览 • 0回复
谷歌重磅发布CAT3D：一分钟搞定任意数量视图到3D场景重建

angel • 2683浏览 • 0回复
无需3D数据也能训练，港科&港中文联手华为推出3D自动驾驶场景生成模型

Crystalcxt • 1498浏览 • 0回复
浙大、蚂蚁集团推出MaPa：文本生成超真实3D模型

Aceryt • 1492浏览 • 0回复
高质量3D生成最有希望的一集？GaussianCube在三维生成中全面超越NeRF

轻薄滴假象 • 1382浏览 • 0回复
上科大、影眸联合提出DressCode：从文本生成3D服装板片

轻薄滴假象 • 1725浏览 • 0回复
DreamTech联合南大和牛津发布最强3D内容生成大模型——Direct3D

angel • 1510浏览 • 0回复
3D版"裁缝"开源来袭！Tailor3D:自定义3D编辑和资产生成（港大&上海AI-Lab&港中文）

angel • 1216浏览 • 0回复
一分钟原画变3D角色，清华VAST成果入选图形学顶会SIGGRAPH

Crystalcxt • 1359浏览 • 0回复
快速和高质量的3D编辑和身份保持新策略：DreamCatalyst

angel • 1507浏览 • 0回复
Stability.ai开源3D模型，仅需0.5秒就能快速生成

Aceryt • 1508浏览 • 0回复
3D人体重建新SOTA！清华&腾讯等重磅发布MagicMan：单一图像生成高质量人体新突破

angel • 1413浏览 • 0回复
英伟达提出LATTE3D：大规模高质量的Amortized文本到增强3D 合成

angel • 1110浏览 • 0回复
麻省理工创新模型：用2D视频扩散，生成 3D 视频

Aceryt • 1348浏览 • 0回复
3D生成基础模型来了！只需5秒，高质量3D资产规模化生成！南洋理工等重磅开源3DTopia-XL

angel • 976浏览 • 0回复
生成任意3D和4D场景！GenXD：通用3D-4D联合生成框架 | 新加坡国立&微软

angel • 728浏览 • 0回复
3D任意部位分割：FIND 3D模型实现零样本开放世界文本查询分割

AIGC最前线 • 612浏览 • 0回复
革新3D材质生成！Material Anything：端到端打造任意3D物体的高质量材质！

angel • 983浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

高盛：DeepSeek等中国大模型，加速AI对全球GDP贡献 2天前发布
清华、中南开源3D交互实体AI Agent LEGENT 3天前发布

热门推荐

带你一文读懂爆火的 DeepSeek-R1 新模型技术，为何震动了全球 AI 圈 1回复

手把手教你在本地部署 DeepSeek R1，并集成到 Dify 中，建议收藏！ 0回复

一文说清楚"知识蒸馏"（让“小模型”也能拥有“大智慧”） 0回复

国家队出手！DeepSeek上线国家超算互联网平台，免注册开箱即用！ 0回复

被 DeepSeek 带火的蒸馏到底是啥 0回复

上一篇：哈佛、麻省推出面向医学多模态助手—PathChat

下一篇：苹果开源视觉模型界的“瑞士军刀”，能执行数十种任务

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载