实时可编辑3D重建！鼠标拖拽就能控制，港大VAST浙大联合出品

Crystalcxt

发布于 2024-4-23 09:52

浏览

0收藏

最近，高斯溅射（Gaussian Splatting）在新视角合成领域掀起了一轮革命性浪潮，取代上一代技术神经辐射场（NeRF）成为学界业界顶流。而真实场景往往是动态的，如何合成动态场景的新视角是更具价值与挑战的领域。

随着图形学与AI的发展，数字资产的创造日益引起人们的重视。对于重建的真实场景进行编辑也是AIGC领域业内关注的热门方向，其为制作数字资产提供了高效与便捷。

香港大学CVMI实验室携手3D大模型公司VAST与浙江大学，提出了目前SOTA的动态高斯溅射模型SC-GS，并支持用户交互式实时编辑重建的场景。

△面向可编辑动态场景的稀疏控制高斯溅射

SC-GS支持用户对重建的动态高斯进行实时交互编辑，制作新的场景运动或形状：

实时可编辑3D重建！鼠标拖拽就能控制，港大VAST浙大联合出品-AI.x社区

使用鼠标的拖拽与键盘组合按键就能够方便的操作。

△实时交互编辑

怎么做到的？

SC-GS的灵感来源于对自然世界大多数动态过程的观察，由于物质大多数都是刚性或连续的，因此物体的移动往往可以由稀疏的变形基底表示，并不需要稠密的变形场进行建模。

摒弃了大多数现有方法对动态场景的变形场进行稠密建模的方案，SC-GS突破性地引入稀疏的控制点对动态场景的变形进行表示与建模，并由一个神经网络预测每个控制点在不同时刻的运动状态，从而驱动整个场景中的动态高斯进行变形。

SC-GS首先初始化少数各向同性的球状高斯结合神经网络预测的运动进行渲染，使用渲染结果拟合动态场景的多视角图片，得到粗糙但不过拟合的变形场建模。

通过对这些球状高斯进行降采样，得到预设数量的稀疏控制点，并通过径向基函数插值得到标准空间中各个高斯在不同时刻的变形参数进行驱动变形。

训练过程中，稀疏控制点，神经网络还有高斯共同训练优化，实现动态场景的建模。

研究团队发现稀疏控制点虽然能够完美解决变形场过拟合到训练视角的问题，但其重建的变形也会出现不符合真实物理的现象。这是由于控制点的运动缺乏物理约束，容易出现交错与碰撞。

因此研究团队引入了局部刚性约束，限制控制点与邻接点形成的边在运动过程发生非刚性变形，以让控制点的运动规律尽可能地符合真实物理。

这一约束进一步提升了动态新视角合成的性能。

基于训练完成的模型，通过分析控制点的轨迹，能够得到控制点连接形成的图结构与各个边上的刚性权重。通过对该图进行“尽可能刚性”（ARAP）的变形，能够以符合物理的条件对建模场景进行编辑。

由于变形的对象是稀疏的控制点，因此变形过程能够实时进行，这也为交互式编辑提供了可能，让用户能够更高效，更便捷的创建属于自己的数字资产。

△基于稀疏控制点驱动稠密高斯的方法框架

实验结果

SC-GS能够对建模场景进行交互式编辑，制作新的场景运动或形状。

实时可编辑3D重建！鼠标拖拽就能控制，港大VAST浙大联合出品-AI.x社区

△动作形状编辑结果

SC-GS提供了方便快捷的编辑方案，在可视化窗口界面利用鼠标拖拽与键盘按键即可实现。

此外，SC-GS能够以SOTA的性能合成动态场景的新视角图片，对于精细的几何纹理细节都有着最高的保真度。对于人体手指，恐龙骨骼等精细部位的渲染都有着精准的复现。

△DNeRF数据集定性对比，SC-GS超过现有方法达到最佳视觉质量

定量实验同样表明，SC-GS远超现有方法，在DNeRF数据集上实现了均值超过40的PSNR指标。

△SC-GS全面大幅度超越现有的动态场景新视角合成方法

最后研究人员表示：

SC-GS让我们看到了高斯溅射在动态场景与交互式编辑方面的潜力，我们期待2024年会有更精彩的工作与探索。

项目主页：https://yihua7.github.io/SC-GS-web/
论文链接：https://arxiv.org/pdf/2312.14937.pdf
代码仓库：https://github.com/yihua7/SC-GS

本文转自量子位，作者：量子位

原文链接:https://mp.weixin.qq.com/s/6jqZ6Ef3SNbx9TW9zxow1A

标签

模型

相关推荐

借助神经结构光，浙大实现动态三维现象的实时采集重建

轻薄滴假象 • 1193浏览 • 0回复
DiT架构大一统：一个框架集成图像、视频、音频和3D生成，可编辑、能试玩

轻薄滴假象 • 1475浏览 • 0回复
谷歌重磅发布CAT3D：一分钟搞定任意数量视图到3D场景重建

angel • 2691浏览 • 0回复
无需3D数据也能训练，港科&港中文联手华为推出3D自动驾驶场景生成模型

Crystalcxt • 1517浏览 • 0回复
5秒完成3D生成，真香合成数据集已开源，上交港中文新框架超越Instant3D

Crystalcxt • 1341浏览 • 0回复
浙大、蚂蚁集团推出MaPa：文本生成超真实3D模型

Aceryt • 1508浏览 • 0回复
CVPR`24 | 4D编辑哪家强？浙大首次提出通用指导4D编辑框架：Instruct 4D-to-4D

angel • 1545浏览 • 0回复
DreamTech联合南大和牛津发布最强3D内容生成大模型——Direct3D

angel • 1516浏览 • 0回复
3D版"裁缝"开源来袭！Tailor3D:自定义3D编辑和资产生成（港大&上海AI-Lab&港中文）

angel • 1238浏览 • 0回复
编辑能力无上限！北航&谷歌&旷视等开源Chat-Edit-3D: 3D 场景编辑新范式！

angel • 1156浏览 • 0回复
ECCV`24 | 首次解决文本到3D NeRFs分解问题！港中文等提出DreamDissector

angel • 1026浏览 • 0回复
Stability.ai开源3D模型，仅需0.5秒就能快速生成

Aceryt • 1531浏览 • 0回复
随意画个草图就能生成3D交互游戏场景！腾讯XR出品

angel • 1849浏览 • 0回复
港理工&OPPO&Stability AI联合发布一致且高效的3D场景编辑方法——SyncNoise

angel • 836浏览 • 0回复
港理工&OPPO&Stability AI联合发布一致且高效的3D场景编辑方法——SyncNoise

angel • 622浏览 • 0回复
生成任意3D和4D场景！GenXD：通用3D-4D联合生成框架 | 新加坡国立&微软

angel • 743浏览 • 0回复
弥补2D拖拽缺陷！南大&蚂蚁等重磅开源LeviTor：首次引入3D目标轨迹控制，效果惊艳

angel • 597浏览 • 0回复
PartGen：基于多视图扩散模型的多模态部件级3D生成和重建！

angel • 544浏览 • 0回复
几秒生成逼真3D场景，泛化媲美Stable Diffusion | 浙大&蚂蚁等提出Prometheus

angel • 538浏览 • 0回复