推出先进大型语言模型 Meta官宣深入AI大战

人工智能
脸书母公司Meta首席执行官扎克伯格最新推出了“Meta人工智能大型语言模型”,简称“LLaMA”。

扎克伯格在社交媒体上称,Facebook AI Research研发的LLaMA是“目前水平最高的”大型语言模型,目标是帮助研究人员推进他们在人工智能(AI)领域的工作。

“大型语言模型”(LLM)可以消化大量的文本数据,并推断文本的单词之间的关系。随着计算能力的进步,以及输入数据集与参数空间的不断扩大,LLM的能力也相应提高。

目前,LLM已经被证明能高效地执行多种任务,包括文本生成、问题回答、书面材料总结等。扎克伯格称,LLM在自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。

值得一提的是,近期大火的ChatGPT就是采用LLM构建的聊天机器人。ChatGPT由GPT3.5提供支持,而GPT3.5是一款基于OpenAI 175B参数基础模型训练的LLM,175B是它从训练数据中所学习、沉淀下来的内容。

Meta在官网介绍中称,LLaMA有7B、13B、33B和65B四个基础模型,在大多数基准测试中都优于GPT3.5的前身GPT3-175B,而LLaMA-65B可与业内最佳的Chinchilla-70B和PaLM-540B竞争。

责任编辑:庞桂玉 来源: 比特网
相关推荐

2023-02-25 16:14:36

AIMeta语言模型

2023-09-27 07:39:57

大型语言模型MiniGPT-4

2023-02-28 07:03:09

AIMeta大型语言

2023-06-24 19:59:40

2023-05-22 14:11:22

MetaAI芯片

2024-03-28 11:15:36

开源AI

2023-03-22 11:44:49

NVIDIAGTC

2023-05-25 16:24:13

2024-04-16 16:14:01

人工智能LLMRAG

2023-05-31 09:48:01

开源AI

2023-06-19 16:05:22

大型语言模型人工智能

2023-12-12 13:52:00

数据训练

2023-11-03 20:02:37

2023-06-12 14:15:38

AI开源

2021-11-12 09:03:49

Windows 11操作系统微软

2024-08-13 13:11:02

2023-04-18 17:23:00

Meta开源

2023-12-13 11:16:34

微软Phi-2大型语言模型

2023-06-09 08:00:00

QLoRa语言模型微调

2023-07-19 07:48:21

Llama 2 模型Azure AI
点赞
收藏

51CTO技术栈公众号