速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言

duhorse

发布于 2024-5-30 13:32

浏览

0收藏

真正Open的AI公司Mistral又低调上新了。

这次，他们发布了首款代码生成模型Codestral，支持80多种编程语言以及32K长上下文窗口。

不仅在基准测试上取得了惊艳的表现，而且代码生成的速度也让试用的网友非常满意。

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言-AI.x社区

目前，Codestral提供了多种API，而且模型权重也公开在HuggingFace上。

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言-AI.x社区

项目地址：https://huggingface.co/mistralai/Codestral-22B-v0.1/tree/main

代码生成新SOTA

Codestral的训练数据包含80多种编程语言，包括最流行的Python、Java、C、C++和Bash，以及HTML、JavaScript等前端语言，在Swift和Fortran上也有良好表现。

模型可以完成的任务包括编写特定功能的函数、编写测试，以及代码填充。

此外，由于Codestral同时精通英语，也可以与开发人员进行交互，有助于提高工程师的编码水平并减少错误和漏洞。

可以通过Le Chat对话界面免费使用模型的交互功能。

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言-AI.x社区

在线地址：https://chat.mistral.ai/chat

作为一个参数量只有22B的模型，Codestral实现了32K的长上下文窗口，是Llama 3 70B的四倍。

Codestral使用了Llama架构，但在7种语言的HumanEval均分超过了CodeLlama，可以和Llama 3打个平手。

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言-AI.x社区

RepoBench是一个用于评估存储库级代码补全任务的新基准，考验模型的跨文件检索和理解长上下文能力。在RepoBench上，Codestral使用Python语言达到了SOTA成绩。

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言-AI.x社区

此外，在其他语言的评估中，包括C++、bash、Java、PHP、Typescript和C#，Codestral也取得了不错的成绩。

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言-AI.x社区

FIM基准可以评估模型在中间填充任务上的性能，但CodeLlama和Llama不直接支持这个功能。

在FIM任务中，Codestral用更少的参数量，在Pyhon、JavaScript和Java三种语言上的分数全面超过DeepSeek Coder 33B。

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言-AI.x社区

目前，Mistral开放了两个API供开发者调用Codestral，分别是codestral.mistral.ai和api.mistral.ai，前者有8周的免费测试期，后者按token收费。

此外，还可以通过Continue.dev或者Tabnine插件在VSCode或JetBrains的IDE中使用Codestral的功能。

开发者们已经用上了

基准测试毕竟只是参考，代码工具好不好用，只有试过才知道。

有网友感叹「80种语言太疯狂了」「终于有人想起来Swift了」。

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言-AI.x社区

而且实测中可以看到，Codestral的代码生成速度非常快，而且响应延迟也很短。

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言-AI.x社区

有人给了GPT-4o和Codestral相同的任务，让它们用Go语言实现基本的发布/订阅系统。

虽然两个模型的响应延迟都很短，但Codestral写完的时候，GPT-4o刚写到一半，生成速度高下立现。

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言-AI.x社区

有开发者分析，虽然Codestral不是最大、最好的代码模型，但自己还是会从Claude Opus爬墙，改用Codestral。

因为模型确实包含了更多前沿知识，可以帮助编写最新的AI代码，但ChatGPT和Opus都做不到。

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言-AI.x社区

但也有Python工程师吐槽：「没有一个LLM明白，在Python 3.9之后的版本中，就不再需要使用from typing import List了。」

「GPT-4、GPT-4o、Claude Opus、Gemini和Codestral都无法理解这一点。即使明确说明，它们仍然无法理解。」

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言-AI.x社区

看来人类程序员剩下的为数不多的优势还有「知错就改」。

本文转自新智元，作者：新智元

原文链接:https://mp.weixin.qq.com/s/4dN_oEgUHyJLcRVygKKabw

标签

代码

生成模型

相关推荐

Mistral开源8X22B大模型，OpenAI更新GPT-4 Turbo视觉，都在欺负谷歌

轻薄滴假象 • 987浏览 • 0回复
GPT-4o 的数学又双叕进步了？来 MathBench 看看新版 GPT-4o 到底强在哪！

恋恋青鸟 • 1668浏览 • 0回复
天下武功唯快不破，GPT-4o真的牛

ermulong • 861浏览 • 0回复
AutoCoder：性能超越GPT-4o的模型，居然只有33B，还是开源！

大语言模型论文跟踪 • 2818浏览 • 0回复
Mistral 开源代码模型夺得王座！Codestral疯狂训练超80种语言，国内通义开发者请求出战！

51CTO技术栈 • 1641浏览 • 0回复
GPT-4o背后可能的语音技术

鱼虫子 • 1158浏览 • 0回复
超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了

duhorse • 2401浏览 • 0回复
对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！

Aceryt • 1473浏览 • 0回复
开源模型王座一夜易主，GPT-4o被超越

duhorse • 783浏览 • 0回复
Mistral开源首个多模态大模型—Pixtral 12B

Aceryt • 876浏览 • 0回复
阿里史上最大规模开源发布，超GPT-4o 、Llama-3.1！

Aceryt • 736浏览 • 0回复
击败GPT-4o、仅次于o1！英伟达重磅开源超强大模型--Nemotron

Aceryt • 1588浏览 • 0回复
重磅开源Nemotron大模型：击败GPT-4o、仅次于o1！

51CTO技术栈 • 525浏览 • 0回复
超GPT-4o，1240亿参数！最强开源多模态模型 Pixtral Large！

Aceryt • 596浏览 • 0回复
Qwen2-VL (2B、7B、72B)：迄今为止最好的开源视觉模型！！（击败 Claude 和 GPT-4o）

老蛀虫 • 923浏览 • 0回复
微软发布Phi-4，最强小模型！参数极小、超GPT-4o

Aceryt • 434浏览 • 0回复
微软开源最强小模型Phi-4，超GPT-4o、可商用

Aceryt • 400浏览 • 0回复
清华团队靠强化学习让 7B 模型打败 GPT-4o 数学推理

Aceryt • 431浏览 • 0回复
DeepSeek-R1-Distill-Qwen-1.5B 在某些基准测试中超越了 GPT-4o

Halo咯咯 • 174浏览 • 0回复

duhorse

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言

代码生成新SOTA

开发者们已经用上了

目录