时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

人工智能 新闻
5月14日,开源的大语言模型Falcon 2发布,性能超越Llama 3,消息登上了Hacker News热榜第一。「猎鹰」归来,开源宇宙将会迎来新的霸主吗?

这几天,全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引,与此同时,OpenAI的挑战者们也在同步创造历史。

就在5月14日,阿布扎比先进技术研究委员会(ATRC)下属的技术创新研究所(TII),发布了新一代的Falcon 2模型。

Falcon 2 11B已开启访问,Falcon 2 11B VLM将在5月14日中午12点开放

图片

新一代「猎鹰」(Falcon意为猎鹰)重返竞技场,一经推出,迅速登上了HN热榜第一。

去年Falcon首次推出就技惊四座,以碾压性的优势超越了Llama。

根据Hugging Face排行榜,这次推出的Falcon 2 11B性能再次超越了Llama 3 8B,与领先的Gemma 7B性能相当,平均性得分仅差0.01。

Falcon 2包括两个版本:Falcon 2 11B和Falcon 2 11B VLM。

前者是在 5.5 万亿个token上训练出的大语言模型,后者则在此基础上开发的「视觉到语言」模型。

作为一款开源的大语言模型,Falcon 2不仅具备多语言能力,而且支持多模态,可以将视觉输入无缝转换为文本输出,这种功能是当今大模型市场中的首创。

只需要在用户界面上传一张图片并输入提示,就可以得到一段关于图片的文字描述

多语言+多模态

Falcon 2 11B 具有多语言能力,可以快速响应英语、法语、西班牙语、德语、葡萄牙语和其他各种语言的任务。

Falcon 2 11B VLM 作为视觉语言模型,能够从环境中识别和解释各种视觉信息,因此在医疗、金融、电子商务、教育和法律等领域有广泛的应用场景。

比如用于文档管理、上下文索引等任务,而且其「视觉到语言」的功能还有望在未来为视障人群提供帮助。

此外,Falcon 2只需一个GPU就能高效运行,可以轻易部署在笔记本电脑上。

为了加快推进Falcon商业化的进程,去年11月,ATRC就成立了一家新公司——AI71

基于Falcon模型,AI71已经进军阿联酋的教育、医疗、法律等多个领域,并计划很快拓展到阿联酋以外。Falcon的本次升级,为其商业化进程提供了有力支撑。

坚持开源的Falcon

TII发布的人工智能模型,在全球范围内一直名列前茅,新推出的Falcon 2 11B 模型让TII的地位再次得到稳固。

更重要的是,本次更新的两个模型版本均已开源,全世界的开发人员都可以不受限制地使用,并在此基础上进行开发和部署。模型展现出的优秀性能意味着TII有望与Meta竞争开源宇宙霸主的地位。

阿布扎比先进技术研究委员会(ATRC)秘书长 Faisal Al Bannai 承诺,将会坚持推动开源创新,帮助全世界的开发者们实现他们的AI之旅。

TII首席研究员Hakim Hacid博士也表示「开发人员正在认识到更小、更高效模型的无数好处······这是下一个新兴的大趋势。此外,Falcon 2的视觉转语言能力为人工智能的易用性开辟了新的前景,为用户提供了变革性的从图像到文本的交互方式。」

TII还透露其正在酝酿Falcon 2下一代模型,推出时间将在不久之后,这些模型的性能将通过专家混合(MoE)技术得到进一步增强。

开源与闭源之争,战局未定。但无论如何,TII已经成为AGI领域的一支劲旅,这背后是阿联酋自上而下形成的合力,他们正全力推动人工智能的发展,将这项技术视为继石油之后的下一个经济支柱。

Falcon不仅仅是作为「严肃的参与者」而存在,而是雄心勃勃振翅盘旋的「猎鹰」。

责任编辑:张燕妮 来源: 新智元
相关推荐

2023-06-02 13:55:57

开源AI

2023-09-07 13:25:00

AI模型

2021-03-04 20:38:49

Open RAN网络通信

2022-07-21 13:18:58

LinuxWindows

2010-05-28 10:39:00

乔布斯苹果

2022-07-12 09:24:48

LinuxWindows 11

2024-09-13 09:14:32

2024-04-09 13:21:00

AI开源

2023-05-19 10:26:01

谷歌模型

2012-05-04 10:30:14

XTools谢亿民云计算

2015-11-02 10:00:31

数据格局

2024-04-19 09:17:33

AI模型

2021-11-15 11:08:02

微软苹果商业模式

2021-04-27 15:23:55

Windows10操作系统微软

2024-04-01 12:10:48

数据训练

2024-11-06 12:31:41

2014-03-13 09:29:30

程序员码农

2024-08-30 12:56:03

2024-07-10 14:35:19

2023-11-06 11:26:55

模型开源
点赞
收藏

51CTO技术栈公众号