重大新闻(lmsys.org):Gemini 1.5 Flash/Advanced逼近GPT-4o,排名第二!

发布于 2024-5-29 12:01
浏览
0收藏

重大新闻——Gemini 1.5 Flash、Pro和Advanced版本的结果出来了!🔥

  • Gemini 1.5 Pro/Advanced 排名第二,正在逼近GPT-4o
  • Gemini 1.5 Flash排名第九,性能超越了Llama-3-70b,几乎达到了GPT-4-0125
  • Pro版本比4月份的版本有了显著的提升。Flash的成本、能力和无与伦比的上下文长度使其成为市场的变革者!​

重大新闻(lmsys.org):Gemini 1.5 Flash/Advanced逼近GPT-4o,排名第二!-AI.x社区

​https://x.com/lmsysorg/status/1795512202465845686​

重大新闻(lmsys.org):Gemini 1.5 Flash/Advanced逼近GPT-4o,排名第二!-AI.x社区

更令人兴奋的是,在中文领域,Gemini 1.5 Pro和Advanced现在是世界上最好的排名第一的模型。Flash变得更加强大!

重大新闻(lmsys.org):Gemini 1.5 Flash/Advanced逼近GPT-4o,排名第二!-AI.x社区

也看到新的Gemini家族在的新“Hard Prompts”类别中保持领先,这个类别包含了更具挑战性、需要解决问题的用户查询。

Hard Prompts的信息:

https://lmsys.org/blog/2024-05-17-category-hard/

重大新闻(lmsys.org):Gemini 1.5 Flash/Advanced逼近GPT-4o,排名第二!-AI.x社区

模型强度的置信区间和链接

重大新闻(lmsys.org):Gemini 1.5 Flash/Advanced逼近GPT-4o,排名第二!-AI.x社区

重大新闻(lmsys.org):Gemini 1.5 Flash/Advanced逼近GPT-4o,排名第二!-AI.x社区

​https://x.com/huybery/status/1795432194460340708​

本文转载自 PaperAgent​,作者: PaperAgent

收藏
回复
举报
回复
相关推荐