谷歌推出其最强大的AI模型Gemini

人工智能
大型语言模型Gemini将包括三种不同的套件:Gemini Ultra,其最大、功能最强大的类别,Gemini Pro,可扩展到各种任务,以及Gemini Nano,它将用于特定任务和移动设备。

谷歌于当地时间周三发布了其认为最强大的AI模型,该公司面临着越来越大的压力,需要回答它将如何通过AI盈利。

大型语言模型Gemini将包括三种不同的套件:Gemini Ultra,其最大、功能最强大的类别,Gemini Pro,可扩展到各种任务,以及Gemini Nano,它将用于特定任务和移动设备。

目前,该公司计划通过谷歌云将Gemini授权给客户,让他们在自己的应用程序中使用。从12月13日开始,开发人员和企业客户可以通过Google AI Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro。Android开发者也将能够使用Gemini Nano进行构建。Gemini还将被用来支持谷歌的产品,如Bard聊天机器人和搜索生成体验,它试图用对话风格的文本回答搜索查询(SGE还没有广泛使用)。

企业可以使用它通过聊天机器人和产品推荐来进行更高级的客户服务,并为希望为产品做广告的公司识别趋势。如果一家公司想要创建营销活动或博客内容,以及想要为开发人员总结会议或生成代码的生产力应用程序,Gemini也可以用于内容创建。

该公司提供了一些例子,包括展示Gemini能够截取图表的屏幕截图,并分析数百页研究报告,然后更新图表,另一个例子是分析一个人的数学作业的照片,找出正确的答案并指出错误的答案。

Gemini Ultra是第一个在大规模多任务语言理解(MMLU)上超越人类专家的模型,该公司周三在一篇博客文章中表示,MMLU使用数学、物理、历史、法律、医学和伦理学等57门学科的组合来测试世界知识和解决问题的能力。据推测,它可以理解复杂主题中的细微差别和推理。

周三,谷歌的首席执行官桑达尔·皮查伊在一篇博文中写道:“Gemini是整个谷歌团队大规模合作的结果,包括我们在谷歌研究院的同事。它从一开始就是多模式的,这意味着它可以概括并无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。”

从今天开始,谷歌的聊天机器人Bard将使用Gemini Pro帮助进行高级推理、规划、理解和其他功能。高管们周二在与记者的电话会议上表示,明年初,该公司将推出“Bard Advanced”,将使用Gemini Ultra。

此次更新是在搜索巨头谷歌首次推出Bard八个月后,以及OpenAI在GPT-3.5上推出ChatGPT一年后发布的。今年3月,这家由奥特曼领导的初创公司推出了GPT-4。高管们周二表示,Gemini Pro的表现好于GPT-3.5,但回避了有关它如何与GPT-4抗衡的问题。

然而,根据谷歌周三发布的一份白皮书,Gemini的Ultra模型在几个基准测试中的表现优于GPT-4。

当被问及谷歌是否有计划对访问Bard Advanced收费时,谷歌Bard总经理Sissie Hsiao表示,谷歌专注于创造良好的体验,目前还没有任何盈利细节。

在新闻发布会上,当被问及与当前一代的LLM相比,Gemini是否具有任何新的能力时,谷歌DeepMind产品副总裁伊莱·柯林斯回答说:“我认为是这样的”,但该公司仍在努力了解Gemini Ultraa的新能力。

据报道,谷歌推迟了Gemini的发布,因为它还没有准备好,这让人想起了该公司在今年年初艰难推出其AI工具的记忆。

多名记者询问了延迟的原因,柯林斯回答说,测试更先进的型号需要更长的时间。柯林斯说,Gemini是该公司构建的经过最严格测试的AI模型,并且它拥有谷歌所有模型中“最全面的安全评估”。

柯林斯表示,尽管是最大的模型,但Gemini Ultra的服务成本要低得多。“它不仅更有能力,而且更有效率,”他说,“我们仍然需要大量的计算机来训练Gemini,但我们训练这些模型的能力正在变得更加高效。”

柯林斯表示,该公司将于周三发布一份技术白皮书,其中包含该型号的更多细节,但表示不会公布周长计数。今年早些时候,记者发现,谷歌当时最新的AI模型——Palm 2大型语言模型,用于训练的文本数据量是其前身LLM的近五倍。

同样在周三,谷歌推出了用于训练AI模型的下一代张量处理单元。谷歌表示,Salesforce和初创公司Lightricks已经开始使用TPU v5p芯片,其性价比高于2021年宣布的TPU v4,但该公司没有提供与市场领头羊英伟达相比的业绩信息。

在谷歌10月份的第三季度收益电话会议上,投资者向高管们询问了更多关于它将如何将AI转化为实际利润的问题。

今年8月,谷歌推出了一项名为搜索生成性体验(SGE)的早期实验,让用户看到使用搜索引擎时GenAI体验是什么样子 - 搜索仍然是该公司的一个主要利润中心,其结果是更具对话性,反映了聊天机器人的时代,然而,它仍被认为是一项实验,尚未向公众推出。

今年5月,Gemini首次在其年度开发者大会Google I/O上宣布了这项实验,自那以来,投资者一直在要求SGE的时间表,Gemini周三的声明几乎没有提到SGE,高管们对其向公众推出的计划含糊其辞,称Gemini将“在明年”并入SGE。

皮查伊在周三的博客文章中说:“这个模型的新时代代表着我们作为一家公司所做的最大的科学和工程努力之一。我真的为未来感到兴奋,也为Gemini将为世界各地的人们带来的机遇感到兴奋。”

责任编辑:姜华 来源: 企业网D1Net
相关推荐

2024-09-30 12:51:56

谷歌AI模型

2023-09-19 20:47:59

谷歌人工智能

2023-12-07 08:39:43

2024-07-23 20:37:06

2023-12-26 14:52:52

谷歌

2023-12-07 19:01:25

2023-12-12 10:57:05

AI谷歌

2024-11-15 13:09:41

2024-10-28 08:46:00

2023-12-07 11:11:01

2024-02-23 07:15:16

生成式 AIGemini 模型浏览器

2024-04-10 13:38:23

谷歌微软模型

2024-10-09 08:27:30

2023-06-28 08:36:44

大语言模型人工智能

2023-09-04 10:05:01

GPT-4AI模型

2020-06-18 09:49:25

谷歌模型机器学习

2023-11-21 14:48:11

2016-11-18 14:07:36

特朗普AI系统大数据预测

2024-02-19 09:27:31

谷歌AI

2023-10-26 19:18:44

模型训练
点赞
收藏

51CTO技术栈公众号