
回复
重大新闻——Gemini 1.5 Flash、Pro和Advanced版本的结果出来了!🔥
https://x.com/lmsysorg/status/1795512202465845686
更令人兴奋的是,在中文领域,Gemini 1.5 Pro和Advanced现在是世界上最好的排名第一的模型。Flash变得更加强大!
也看到新的Gemini家族在的新“Hard Prompts”类别中保持领先,这个类别包含了更具挑战性、需要解决问题的用户查询。
Hard Prompts的信息:
https://lmsys.org/blog/2024-05-17-category-hard/
模型强度的置信区间和链接
https://x.com/huybery/status/1795432194460340708
本文转载自 PaperAgent,作者: PaperAgent