出品 | 51CTO技术栈(微信号:blog51cto)
腾讯开源日第二天!在Hunyuan3D-2.0基础上打造的5款模型终于全部现身!
昨天介绍了,多视图版本模型Hunyuan3D-2-mv,以及轻量级 mini 模型Hunyuan3D-2-mini。
而今天宣布开源的模型则是Turbo系列模型。即Hunyuan3D-2 Turbo、Hunyuan3D-2-mv Turbo和Hunyuan3D-2-mini Turbo。(这样看着有点绕,大家可以翻到第二张图,原模型与Turbo版是上下是对应关系,很清晰~)
✨Turbo版的特点就一个字:快!非常快!因为AI建模涉及到渲染问题,跑起来还是需要耐心的,Turbo这波直接把时长从半分钟干到了1秒钟、甚至是0.5秒!
✨当然,这样Hunyuan3D-2.0家族就有6款模型了,我们简单说说官方给的“选型指南”:
Hunyuan3D-2:需要生成高质量三维模型的用户,参数量高达11B,适合GPU性能较好的设备
Hunyuan3D-2-mini:设备性能受限或需要快速反馈的用户
Hunyuan3D-2-mv:需要多视图控制或手绘多视图的用户,尤其适合原画师、设计师等等
Turbo系列:需要快速生成模型的用户,适合实时场景or快速迭代
💫Turbo系列为啥能做到这么快?背后的杀器就是Flash VDM。今天官方花了很大篇幅去讲背后的实现原理,我们简单总结下,先看第3张图,Flash VDM的核心技术点即DiT 加速和VAE 加速:
Flash VDM通过减少采样数量和优化采样计算过程,将生成模型的迭代步数从50步减少到5步。
并大大降低了VAE解码的时间占比——要知道VAE 解码占据了整个建模75.88%的时间!
经过这个黑科技的加持,Turbo最小显存占用可降低到5GB以下,生成时间缩短到1秒以内,支持4050等显卡,还可以在Mac的M芯片上部署。
最后,团队小哥也上了把价值,这么牛的技术,之所以大方开源,就是为了推动生态的繁荣,让中国AI技术更进一步!
他们还引了一句诗“一枝独秀不是春,百花齐放春满园”。
⭐最后附上链接,大家玩起来吧:
官网:https://3d.hunyuan.tencent.com/
Github:https://github.com/Tencent/Hunyuan3D-2