字节跳动豆包大模型 1.5 Pro 发布，综合得分优于 GPT-4o、Claude 3.5 Sonnet-51CTO.COM

1 月 22 日消息，字节跳动旗下豆包大模型 1.5 Pro 今日正式发布，全新 Doubao-1.5-pro 模型增强了综合能力，在知识、代码、推理、中文等多个测评基准上，综合得分优于 GPT-4o、Claude 3.5 Sonnet 等模型。

目前，Doubao-1.5-pro 已在豆包 App 灰度上线，同时开发者也可在火山引擎直接调用 API 。

据字节跳动官方介绍，豆包大模型 1.5 Pro 使用较小的激活参数进行预训练，采用大规模稀疏 MoE 架构，等效 7 倍激活参数的 Dense 模型性能，远超业内 MoE 架构约 3 倍杠杆的常规效率。

新版豆包视觉理解模型 Doubao-1.5-vision-pro、豆包实时语音模型 Doubao-1.5-realtime-voice-pro 一同发布。

相比上一版本，Doubao-1.5-vision-pro 在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级，进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力，并让模型的回复模式变得更加精简、友好。

豆包大模型 1.5 Pro 本次推出了豆包・实时语音模型，并在豆包 App 全量开放（豆包 App 升级至 7.2.0 版本）。作为一款语音理解和生成一体化的模型，豆包实时语音大模型实现了端到端语音对话，具备低时延、对话中可随时打断等特性。火山引擎将在上半年通过方舟平台推出对应 API 服务。

IT之家从字节跳动官方获悉，豆包大模型 1.5 Pro 宣称“所有模型训练过程中，未使用任何其他模型生成的数据”。豆包大模型 1.5 全产品，包括 Doubao-1.5-pro，Doubao-1.5-lite，Doubao-1.5-vision-pro 等，将继续保持原有模型价格不变，加量不加价。