阶跃星辰重磅开源两款多模态模型!超4万个模型上架阿里云魔搭

业界
2月21日,在今天开幕的全球开发者大会(GDC)上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。截至目前,魔搭社区已上架超过4万个开源模型,涵盖LLM、对话、语音、文生图、图生视频等多个领域,是中国最大的AI模型社区。

2月21日,在今天开幕的全球开发者大会(GDC)上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。截至目前,魔搭社区已上架超过4万个开源模型,涵盖LLM、对话、语音、文生图、图生视频等多个领域,是中国最大的AI模型社区。

此次在魔搭社区开源的两款模型,是近期全球多模态领域最热门的开源模型。Step-Video-T2V是基于300 亿参数的文本转视频预训练模型,能够生成高达 204 帧的视频,在指令遵循、运动平滑性、物理合理性、美感度等方面表现均显著超过市面上既有的开源视频模型。

图为 Step-Video-T2V-Eval 测评结果

另一款上架模型Step-Audio ,是业界首个产品级开源语音模型,参数规模多达1300多亿。根据 Llama Question等5 大主流公开测试,Step-Audio 模型性能均位列第一,并在 HSK-6(汉语水平考试六级)的测评中表现尤佳,是最懂中国话的开源语音交互大模型。

图为 5大主流公开评测结果

目前,阶跃星辰的这两款模型均可在魔搭社区下载和体验。有部署及模型微调需求的开发者和企业,还可通过阿里云人工智能平台PAI-Model Gallery实现一键部署,获取包括阶跃星辰新模型在内的200余款开源模型快速部署、训练及评测服务。

据了解,阿里云最早提出MaaS理念(Model as a Service,模型即服务),魔搭社区即为这一理念的具体实践,将AI模型变为直接可用的服务,为AI开发者提供模型体验、下载、调优、训练、推理、部署等一站式服务。截至目前,魔搭社区已上架千问Qwen、DeepSeek-R1、Llama、零一万物等国内外知名模型,服务超过1000万开发者,“找大模型上魔搭”日渐成为越来越多的AI开发者的默契。

附:

模型下载链接

● Step-Video-T2V:

https://www.modelscope.cn/collections/stepvideo-t2v--wenshengshipin-238aa2a1985d40

● Step-Audio:

https://www.modelscope.cn/collections/Step-Audio-a47b227413534a

(完)

责任编辑:企业资讯
相关推荐

2023-08-03 19:11:45

2023-06-14 11:36:06

阿里云魔搭

2015-06-25 10:36:36

云巅科技云计算

2014-06-05 11:10:47

2024-12-09 08:15:43

2023-12-01 13:36:01

阿里云通义千问

2025-01-08 08:21:16

2018-06-11 19:17:06

阿里云文档开源

2024-04-01 12:10:48

数据训练

2024-08-19 13:35:09

2023-06-06 14:09:32

模型开源

2024-09-10 12:11:18

2024-08-30 15:19:22

2024-08-30 14:35:00

2024-01-22 13:59:00

模型训练

2024-04-02 09:17:50

AI数据开源

2023-05-12 13:14:59

ChatGPTAI工具
点赞
收藏

51CTO技术栈公众号