回复
重大新闻(lmsys.org):Gemini 1.5 Flash/Advanced逼近GPT-4o,排名第二!
重大新闻——Gemini 1.5 Flash、Pro和Advanced版本的结果出来了!🔥
- Gemini 1.5 Pro/Advanced 排名第二,正在逼近GPT-4o
- Gemini 1.5 Flash排名第九,性能超越了Llama-3-70b,几乎达到了GPT-4-0125
- Pro版本比4月份的版本有了显著的提升。Flash的成本、能力和无与伦比的上下文长度使其成为市场的变革者!
https://x.com/lmsysorg/status/1795512202465845686
更令人兴奋的是,在中文领域,Gemini 1.5 Pro和Advanced现在是世界上最好的排名第一的模型。Flash变得更加强大!
也看到新的Gemini家族在的新“Hard Prompts”类别中保持领先,这个类别包含了更具挑战性、需要解决问题的用户查询。
Hard Prompts的信息:
https://lmsys.org/blog/2024-05-17-category-hard/
模型强度的置信区间和链接
- 全部排行榜在:http://leaderboard.lmsys.org
- 与新的Gemini家族聊天:https://arena.lmsys.org/
https://x.com/huybery/status/1795432194460340708
本文转载自 PaperAgent,作者: PaperAgent
赞
收藏
回复
相关推荐