1 月 22 日消息,字节跳动旗下豆包大模型 1.5 Pro 今日正式发布,全新 Doubao-1.5-pro 模型增强了综合能力,在知识、代码、推理、中文等多个测评基准上,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等模型。
目前,Doubao-1.5-pro 已在豆包 App 灰度上线,同时开发者也可在火山引擎直接调用 API 。
据字节跳动官方介绍,豆包大模型 1.5 Pro 使用较小的激活参数进行预训练,采用大规模稀疏 MoE 架构,等效 7 倍激活参数的 Dense 模型性能,远超业内 MoE 架构约 3 倍杠杆的常规效率。
新版豆包视觉理解模型 Doubao-1.5-vision-pro、豆包实时语音模型 Doubao-1.5-realtime-voice-pro 一同发布。
相比上一版本,Doubao-1.5-vision-pro 在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力,并让模型的回复模式变得更加精简、友好。
豆包大模型 1.5 Pro 本次推出了豆包・实时语音模型,并在豆包 App 全量开放(豆包 App 升级至 7.2.0 版本)。作为一款语音理解和生成一体化的模型,豆包实时语音大模型实现了端到端语音对话,具备低时延、对话中可随时打断等特性。火山引擎将在上半年通过方舟平台推出对应 API 服务。
IT之家从字节跳动官方获悉,豆包大模型 1.5 Pro 宣称“所有模型训练过程中,未使用任何其他模型生成的数据”。豆包大模型 1.5 全产品,包括 Doubao-1.5-pro,Doubao-1.5-lite,Doubao-1.5-vision-pro 等,将继续保持原有模型价格不变,加量不加价。