重大新闻（lmsys.org）：Gemini 1.5 Flash/Advanced逼近GPT-4o，排名第二！

PaperAgent

发布于 2024-5-29 12:01

浏览

0收藏

重大新闻——Gemini 1.5 Flash、Pro和Advanced版本的结果出来了！🔥

Gemini 1.5 Pro/Advanced 排名第二，正在逼近GPT-4o
Gemini 1.5 Flash排名第九，性能超越了Llama-3-70b，几乎达到了GPT-4-0125
Pro版本比4月份的版本有了显著的提升。Flash的成本、能力和无与伦比的上下文长度使其成为市场的变革者！

重大新闻（lmsys.org）：Gemini 1.5 Flash/Advanced逼近GPT-4o，排名第二！-AI.x社区

https://x.com/lmsysorg/status/1795512202465845686

更令人兴奋的是，在中文领域，Gemini 1.5 Pro和Advanced现在是世界上最好的排名第一的模型。Flash变得更加强大！

重大新闻（lmsys.org）：Gemini 1.5 Flash/Advanced逼近GPT-4o，排名第二！-AI.x社区

也看到新的Gemini家族在的新“Hard Prompts”类别中保持领先，这个类别包含了更具挑战性、需要解决问题的用户查询。

Hard Prompts的信息：

https://lmsys.org/blog/2024-05-17-category-hard/

重大新闻（lmsys.org）：Gemini 1.5 Flash/Advanced逼近GPT-4o，排名第二！-AI.x社区

模型强度的置信区间和链接

全部排行榜在：http://leaderboard.lmsys.org
与新的Gemini家族聊天：https://arena.lmsys.org/

重大新闻（lmsys.org）：Gemini 1.5 Flash/Advanced逼近GPT-4o，排名第二！-AI.x社区

https://x.com/huybery/status/1795432194460340708

本文转载自 PaperAgent，作者： PaperAgent

标签

GPT-4o

Gemini 1.5

Advanced

相关推荐

GPT-4o：实现跨越文本与视觉的智能交互

51CTO内容精选 • 2361浏览 • 0回复
Sam Altman：GPT-4o幕后揭秘，GPT-5会很特别

Aceryt • 1286浏览 • 0回复
GPT-4o 的数学又双叕进步了？来 MathBench 看看新版 GPT-4o 到底强在哪！

恋恋青鸟 • 1885浏览 • 0回复
GPT-4o做Code Review可行吗？

51CTO技术栈 • 1869浏览 • 0回复
天下武功唯快不破，GPT-4o真的牛

ermulong • 964浏览 • 0回复
现在，所有人都能免费用GPT-4o了！

duhorse • 2628浏览 • 0回复
GPT-4o与SQL：大模型改变自身架构的能力有多强？

51CTO技术栈 • 1039浏览 • 0回复
GPT-4o背后可能的语音技术

鱼虫子 • 1318浏览 • 0回复
GPT-4o不香了

Crystalcxt • 1667浏览 • 0回复
Gemini全面超越GPT-4o，Jeff Dean连转三次

duhorse • 1238浏览 • 0回复
阿里新开源语音模型Qwen2-Audio ，实测优于 Gemini-1.5-pro，网友：离GPT-4o只差一步

51CTO技术栈 • 1443浏览 • 0回复
终于来了，OpenAI测试GPT-4o高级语音模式！

Aceryt • 858浏览 • 0回复
谷歌发布Gemini Live：对标GPT-4o，让每一个人都有贾维斯

Aceryt • 827浏览 • 0回复
开发者终于可以定制自己的GPT-4o了！

51CTO技术栈 • 948浏览 • 0回复
微软发布Phi-4，最强小模型！参数极小、超GPT-4o

Aceryt • 548浏览 • 0回复
谷歌AI发布Gemini 2.0 Flash：比Gemini 1.5 Pro快2倍的新AI模型

Halo咯咯 • 3959浏览 • 0回复
微软开源最强小模型Phi-4，超GPT-4o、可商用

Aceryt • 634浏览 • 0回复
南大&腾讯优图发布GPT-4o级别的实时视觉语音交互——VITA1.5

angel • 518浏览 • 0回复
DeepSeek-R1-Distill-Qwen-1.5B 在某些基准测试中超越了 GPT-4o

Halo咯咯 • 6719浏览 • 0回复

51CTO

51CTO博客

51CTO学堂

重大新闻（lmsys.org）：Gemini 1.5 Flash/Advanced逼近GPT-4o，排名第二！

目录