自22年Chatgpt横空出世来,这项技术改变了世界,也改变了很多人的命运。
图形界面让计算机开始走进千家万户,智能手机更进一步让互联网人人可用,而现在大模型将成为新一代人机交互接口,这势必将掀起一场革命。
这场革命中国正在奋起直追,其中代表性事件就是阿里最新开源的Qwen2登顶。
就在上周,全球著名开源平台huggingface(开源模型网站,类似AI届的GitHub)的联合创始人兼首席执行官Clem在海外社交平台宣布,阿里最新开源的Qwen2-72B指令微调版本,性能超过美国最强的开源模型Llama3-70B,成为开源模型排行榜第一名。
图片
Clem表示,为了提供全新的开源大模型排行榜,使用了300块H100对目前全球100多个主流开源大模型,例如,Qwen2、Llama-3、mixtral等,结果显示,阿里开源的Qwen-2 72B力压科技、社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral成为新的王者,中国在全球开源大模型领域处于领导地位。
而恰逢OpenAI宣布终止对中国提供API服务之际,阿里云百炼平台第一时间宣布,将为OpenAI API用户提供最具性价比的中国大模型替代方案,并为中国开发者提供2200万免费tokens和专属迁移服务。
让我们来看看阿里通义千问与国外各大模型的巅峰对决。
6月7日,Qwen2发布后,仅2小时,Qwen2-72B登顶HuggingFace 开源大模型榜单Open LLM Leaderboard第一名,全球排名最高。
6月14日,Qwen2拿下美国最新测评榜单开源大模型全球第一。
Qwen2-72B在图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun)联合Abacus.AI、纽约大学等机构推出全新的大模型测评基准LiveBench AI中,在开源大模型中排名世界第一,也是十榜单中唯一的开源大模型、唯一的中国大模型。
图片
6月20日,Qwen2在斯坦福大学的大模型测评榜单HELM MMLU中,成为开源模型第一。
MMLU(Massive Multitask Language Understanding,大规模多任务语言理解)是业界最有影响力的大模型测评基准之一,涵盖了基础数学、计算机科学、法律、历史等57项任务,用以测试大模型的世界知识和问题解决能力。
图片
阿里Qwen2的登顶证明了中国在大模型领域有能力达到领先水平。
开源可以让企业以更低的成本使用,充分对各业务场景赋能。除了开源大模型,阿里云百炼平台汇聚了众多开发者,并配备了完善的工具链,而且还能充分保障客户的数据安全,这一点得到了零一万物创始人兼CEO,前Google、微软、苹果全球副总裁李开复的肯定。
也有很多海外开发者在使用阿里开源大模型Qwen2后认为是自Llama 3以来最具影响力的开源LLM:
图片
Qwen2的编码和推理能力比同等规模的 llama-3-8b 更好,无需专门训练即可编写俄罗斯方块游戏。
图片
Qwen 2-72b在几乎所有测试中都比llama3 70b效果更好,尽管尺寸相对较小,但却非常聪明和富有创意,可以在本地运行。
最后,OpenAI用不了?没关系,我们有自己的国产大模型。