GenAI的新潮流:如何利用智能体的力量

人工智能
通过应用类似的策略,我们可以改进大型语言模型(LLM)的输出,从而引出GenAI智能体的概念。GenAI智能体旨在克服当前LLM的许多局限性,能够执行单一模型无法处理的复杂任务。

AI和机器学习的发展历程是颠覆性的。最初,我们从手动编码转向通过数据训练计算机。在早期阶段,AI只能处理特定任务,例如分类和物体识别——这些是它们经过明确训练后能够执行的功能。

但这一切在2022年底随着OpenAI推出ChatGPT而发生了改变,这一突破性工具不仅可以生成内容,还能执行各种任务,迅速吸引了全球数百万人的关注。正如Gartner在2023年AI技术成熟度曲线中所指出的那样,GenAI已经达到了“膨胀期的顶峰”,预计将在未来5到10年内进入“生产力平台期”。

克服挑战与局限性

根据Gartner的定义,达到生产力平台期意味着AI将被广泛采用,其优势将得到明确定义,并有清晰的实施指南。要实现这一目标,我们首先必须解决当前AI技术的局限性,并探索如何通过智能体来克服这些挑战。

尽管当今的大型语言模型(LLMs)在生成电子邮件、写作文章和进行情感分析等任务上表现出色,但它们在处理复杂任务时仍然存在困难,例如复杂的数学计算或多步骤问题解决。此外,LLMs还存在其他显著的局限性:

• 幻觉或误导性输出

• 技术限制,如有限的上下文长度和内存

• 输出中的偏见

• 可能产生有害或不当言论

• 知识有限(例如,ChatGPT 3.5的知识截止日期为2021年9月)

有趣的是,这些挑战与我们人类所面临的问题并无太大不同。我们也容易犯错误、存在偏见、记忆有限,有时甚至会做出有害的回应。为了管理这些不足,我们通常会:

• 在线寻找信息,使用Excel和Word等工具。

• 多次修改我们的工作以纠正错误并提高质量。

• 寻求同事和导师的反馈,并吸收他们的见解。

• 团队合作以取得更好的结果。

通过应用类似的策略,我们可以改进大型语言模型(LLM)的输出,从而引出GenAI智能体的概念。

什么是GenAI智能体?

GenAI智能体旨在克服当前LLM的许多局限性,能够执行单一模型无法处理的复杂任务。例如,如果你想从一个数据集中识别出按收入排名前三的公司,智能体将会:

• 获取所有公司的收入数据。

• 按收入对公司进行排序。

• 返回排名前三的公司。

为了实现这一目标,智能体将LLM与关键组件结合起来,如规划、记忆和工具:

• 规划:智能体使用LLM制定并执行计划。

• 记忆:智能体在执行多个步骤时保留信息,从而能够处理复杂任务。

• 工具:智能体使用各种工具来执行特定任务,以下将对此进行更详细的讨论。

GenAI智能体的关键特性

GenAI智能体被设计为:

• 规划和执行任务

• 反思结果

• 使用工具实现特定目标

• 在最少的人工干预下运行

此类智能体的例子包括网站建设工具、从Excel表格中提供见解的数据分析师,以及根据用户输入规划旅行的旅游代理。

工具在GenAI智能体中的作用

工具对于智能体至关重要,使其能够有效地执行任务。在GenAI的领域中,工具使LLM智能体能够与外部环境和应用程序进行交互,例如进行互联网搜索、代码解释器和数学引擎等,这些工具可以访问数据库、知识库以及外部模型。

例如,一个旅行代理需要工具来搜索和预订航班,还需要搜索互联网的工具。其他工具可能包括:

• 实体提取:从非结构化文档中提取特定信息。

• Chat DB:无需SQL知识即可从数据库中检索信息。

• 知识机器人:使用检索增强生成(RAG)技术,根据自定义知识库回答问题。

• 互联网搜索:根据用户查询从搜索引擎获取内容。

• 摘要生成:为大型文档提供针对特定角色的摘要。

• 程序执行:执行Python代码以解决特定问题。

• 维基百科搜索:根据用户查询从维基百科检索内容。

• 比较:回答比较性问题,如性能指标或产品推荐。

智能体设计模式

为了执行复杂任务,智能体必须有效地协调这些工具。基于Andrew NG的讲座,已经出现了几种智能体设计模式:

• 反思:LLM评估自己的工作以改进输出。

• 工具使用:LLM利用工具,如网络搜索或代码执行,来收集信息和处理数据。

• 规划:LLM制定多步骤计划以实现目标,然后执行该计划。

• 多智能体协作:多个AI智能体协作,分配任务并讨论想法,以寻找更好的解决方案。

尽管前两种模式会产生可预测的结果,但后两种仍处于实验阶段。

LLM智能体框架

基于对智能体、工具和设计模式的理解,规划模式的一种变体逐渐形成。这个框架包括定义一个任务或目标,然后通过迭代的方式规划并执行下一个动作,接着进入反馈循环。

一个LLM智能体由核心组件组成:

• 大脑/LLM:作为协调者。

• 记忆(向量数据库):存储中间步骤和结果。

短期记忆:在上下文窗口内保存上下文信息。

长期记忆:一个外部的向量存储,提供相关的上下文信息。

• 工具/互联网:使智能体能够执行任务,如网络搜索或程序执行。

• 政策:通过设计确保信任,防止处理有害输入。

智能体的未来

GenAI的未来在于智能体与人类的协作。试想一个世界,医生、设计师和客户服务代表都由增强其能力的智能体支持。从科学发现到艺术创作,可能性是无穷的。

对于企业而言,将GenAI智能体融入运营中可以带来战略优势,释放出新的效率提升、个性化服务和问题解决能力,这些智能体不会取代人类的创造力,而是会增强它,推动一个充满创新和进步的未来。

责任编辑:庞桂玉 来源: 企业网D1Net
相关推荐

2013-10-28 16:24:44

2015-07-28 16:34:50

Linux桌面

2011-01-07 09:17:36

2018-07-02 16:54:10

云PBX

2014-06-05 11:19:32

云模式智能家居

2009-09-07 09:12:54

2024-09-30 13:15:57

2021-01-25 16:52:08

VRAR苹果

2009-11-26 10:34:21

2009-02-17 16:21:07

全触控手机操作系统Azingo Mobi

2012-03-28 15:25:52

2014-08-13 16:41:57

SDN数据中心华为

2015-01-14 10:11:29

邮箱用户行为移动办公

2024-07-02 10:29:57

2014-10-09 10:10:19

2014-03-19 15:27:44

智能手环智能硬件可穿戴
点赞
收藏

51CTO技术栈公众号