Mistral杀回来了!Small 3.1开源发布,性能完胜Gemma 3,RTX 4090就能跑

发布于 2025-3-18 08:26
225浏览
0收藏

Mistral 又搞了个 “小而美” 的狠货: Mistral Small 3.1 发布并开源:

Mistral杀回来了!Small 3.1开源发布,性能完胜Gemma 3,RTX 4090就能跑-AI.x社区

号称 “小 3.1”,但能力不 “小”。 多模态、开源 Apache 2.0 协议,关键是性能还杠杠的,直接 PK 掉 Gemma 3 和 GPT-4o mini。

Mistral杀回来了!Small 3.1开源发布,性能完胜Gemma 3,RTX 4090就能跑-AI.x社区

看 Benchmark 图: 横坐标是速度,越小越快; 纵坐标是知识,越大越强。 Mistral Small 3.1,直接霸榜左上角,速度、知识双 Buff 加持。

Mistral杀回来了!Small 3.1开源发布,性能完胜Gemma 3,RTX 4090就能跑-AI.x社区

Mistral 官方列出了 Small 3.1 的关键特性和能力:

• 轻量级: 能在 RTX 4090 或 32GB 内存的 Mac 上运行,适合本地部署。

• 快速响应: 适合虚拟助手等需要快速响应的应用。

• 低延迟函数调用: 能快速执行函数。

• 领域微调: 能针对特定领域进行微调,比如法律、医疗等。

• 高级推理基础: 社区可以在此基础上构建更强的推理模型。

最近几周,已经有一些基于 Mistral Small 3 的优秀推理模型出现,比如Nous Research 的 DeepHermes 24B。Mistral 同时发布了基础模型和指令调优的 checkpoint,方便大家进一步定制。

“AI 智能,两周一降价”, 这趋势有点猛。

有人分析 Mistral Small 3.1,觉得这模型潜力巨大。 虽然现在还不是原生多模态,但 Mistral 可能会憋个大的,直接搞个原生多模态模型出来。

参数 30B 左右,各种模态都支持。 要是真成了,说不定能再现 Mistral 7B 的 “经典时刻”。

Mistral Small 3.1 的基准测试成绩

多张图。

先看多语言能力,Mistral Small 3.1 在欧洲、东亚、中东语言上平均值领先。

Mistral杀回来了!Small 3.1开源发布,性能完胜Gemma 3,RTX 4090就能跑-AI.x社区

长上下文方面,Mistral Small 3.1 只有在RULER 上不如 Claude-3.5 Haiku。

多模态指令上,Mistral Small 3.1 都有显著优势。

Mistral杀回来了!Small 3.1开源发布,性能完胜Gemma 3,RTX 4090就能跑-AI.x社区

文本指令上,Mistral Small 3.1 在 SimpleQA 、GPQA Main、GPQA Diamond 上领先。在 MMLU、MMLU Pro、HumanEval、MATH 上,也是有高有低。

Mistral杀回来了!Small 3.1开源发布,性能完胜Gemma 3,RTX 4090就能跑-AI.x社区


有网友指出,Mistral Small 3.1 参数多、支持多语言、多模态,还没啥限制,就是推理能力差点意思。

Mistral杀回来了!Small 3.1开源发布,性能完胜Gemma 3,RTX 4090就能跑-AI.x社区

但马上有人泼冷水,说简单任务用推理模型就是 “高射炮打蚊子”, 太啰嗦。 他们更喜欢轻量级的模型处理日常小事。

推理能力不是万金油。 像低延迟翻译,速度才是硬道理,要啥推理? 

并且这个模型还开源:

Mistral杀回来了!Small 3.1开源发布,性能完胜Gemma 3,RTX 4090就能跑-AI.x社区

有人觉得 Mistral 完胜, gpt4o-mini 不行。

反方表示,GPT-4 级别大模型的 “底蕴” 还是在那儿,小模型就算加了 RL 也比不了, “隐含知识” 就是值钱。

而又说到基准测试,有眼尖的网友表示:

“ 这测试选的,也太奇怪了吧?对比的模型也怪怪的。Mistral Small 3.0 呢?藏哪儿去了?是不是怕露馅?”

“ 还有,有些地方 Mistral Small 3.1 只是勉强赢了 Gemma3-it-27b,之前 3.0 可是碾压的啊,这啥情况?”

Mistral杀回来了!Small 3.1开源发布,性能完胜Gemma 3,RTX 4090就能跑-AI.x社区

对此,网友表示:“ 最近的模型,都喜欢挑对自己有利的测试,Mistral 更狠,直接无视中国的模型… ”

Mistral杀回来了!Small 3.1开源发布,性能完胜Gemma 3,RTX 4090就能跑-AI.x社区

本文转载自AI进修生,作者:Aitrainee


收藏
回复
举报


回复
相关推荐