7月30日,作为Sora全球首个挑战者,且是国内首个纯自研的视频大模型Vidu(www.vidu.studio)正式上线。生数科技宣布,目前Vidu无需申请,用户直接用邮箱注册即可上手体验。
生数科技作为国内最早布局多模态通用大模型的团队之一,今年4月联合清华大学发布了国内首款全面对标OpenAI Sora的视频大模型Vidu。自4月底首次亮相以来,Vidu凭借媲美Sora的文生长视频能力,迅速在国内外引起广泛关注。此次Vidu全面开放了文生视频、图生视频两大功能,提供4s和8s两种时长选择,分辨率最高达1080P。
在效果上,Vidu不仅延续了四月份展示的高动态性、高逼真度、高一致性等优势,还在上线版本中新增了角色一致性(Character To Video)、动漫风格、文字与特效画面生成等特色能力。同时,在影响用户体验的推理速度层面,Vidu实现了业界最快的实测推理速度,生成一段4秒片段只需30秒。而市面上的主流AI视频工具在生成4秒左右的视频片段时,用户通常需要等待1到5分钟,甚至更长。 Vidu的高效推理不仅为用户带来了接近于无缝的创作体验,更短的处理时间还意味着它能够轻松应对大量用户的需求,提供个性化的服务。
众所周知,视频生成产品的开发周期长且费用高昂。而从发布到上线仅仅三个月,生数科技就完成了对Vidu的快速迭代,实现了高质量的视频生成效果,这离不开Vidu研发团队在模型高效训练方面积累的工程化经验。密集而快节奏的模型训练任务,不仅需要大规模的算力,还需要从数据准备到模型训练、再到模型推理的全链路保障。
Vidu在模型训练层面采用了百度百舸·AI异构计算平台。百舸是百度智能云基于过去多年在 AI 方面的沉淀,以GPU为核心搭建的异构计算平台,更适合大模型训练,保障模型训练的稳定性和效率。
在提升模型训练效率方面,百舸可以把不同地点、不同规模、不同集群的算力统一管理起来,通过芯片性能优化、自动芯片选型、潮汐混部这些经验和技术,大幅提升智能算力效能,万卡集群上的模型有效训练时长占比超过98.8%,线性加速比和带宽有效性均超过了95%,是业界领先的算力效能。
在提升模型训练稳定性方面,百舸提供了丰富的运维和可观测工具以及容错保障能力,提升了大规模集群长期运行的稳定性,降低因为故障导致训推任务异常终止的概率,减少业务损失。
同时,百舸支持混合多芯,兼容昆仑芯、N腾、海光DCU、英伟达、英特尔等国内外主流AI芯片,支持同一智算集群中混合使用不同厂商芯片,最大程度上屏蔽硬件之间差异,帮助企业摆脱单一芯片依赖,实现更优的成本,保证更有弹性的供应链。在多芯混合训练任务中,百舸能够将单芯片利用率、芯片间通信效率、集群整体效能发挥到极致,百卡规模性能损失不超过3%,千卡规模性能损失不超过5%,均为国内领先水平。
百舸高效、稳定、混合多芯等特点能够帮助生数科技实现大模型开发的“快、稳、省”,助力生数科技短时间低成本完成大模型的业务上线。目前,百舸已经在互联网、教育、汽车、生命科学等行业有了广泛的落地实践,帮助行业客户实现大模型应用的快速落地。
未来,生数科技将不断基于百度百舸·AI异构算力计算平台持续训练、提升模型能力,并逐步通过百度智能云千帆平台开放模型服务。