
《基础代理的进步与挑战,从大脑启发智能到进化、协作和安全系统》第一部分:智能代理的核心组件
人工智能领域正迎来一场从被动工具到主动智能的革命,而这一趋势的核心推手便是基础代理(Foundation Agents)的崛起。基础代理不仅是现有大语言模型(LLMs)和多模态模型(LMMs)的延续,更是迈向类人智能系统的重要里程碑。它们以强大的感知、决策和执行能力,试图在认知和行动中复制甚至超越人类智能。
这一切离不开脑启发智能(Brain-Inspired Intelligence)的重要推动。研究人员从人类认知体系中汲取灵感,模拟大脑在感知、记忆、推理和行动中的复杂机制,将这些生物过程转译为高度优化的算法和系统架构。但这一目标并非止步于模仿,基础代理的最终愿景是构建能够自主学习、协作演化,并在复杂动态环境中展现出强大适应性的智能系统。
图1.1:按主要大脑区域分组的关键人脑功能示意图,根据其在人工智能研究中的当前探索水平进行注释。这一数字突出了现有的成就、差距和将人工智能推向更全面、更受大脑启发的能力的潜在机会。
随着基础代理技术的演进,新一代智能系统正逐步渗透至人类生活的各个领域。从多模态交互中实现更智能的数字助手,到机器人通过工具与物理环境的深度融合,它们不仅代表了AI技术的集大成者,更是工业、科学与社会变革的催化剂。正是在这样的背景下,本文献站在学术与产业交汇的前沿,深入探讨基础代理从脑启发智能向协作和安全系统演化所面临的机遇与挑战。
4 月4 日,arVix 发表的重要人工智能技术文献《Advances and Challenges in Foundation Agents》,文献第一部分:智能代理的核心组件以敏锐的洞察力全面揭示了基础代理的架构及其发展的关键路径。文献从智能代理的核心组件切入,深入剖析了感知系统、行动系统以及工具与记忆整合模块在实现类人智能中的作用。
本文将着重解读文献第一部分:智能代理的核心组件以下几个方面的内容:
- 感知系统——如何模拟人类多模态感知以实现对复杂环境的精确理解。
- 行动系统——从行动空间到行动学习,如何构建更高效、更稳健的决策框架。
- 工具与记忆整合——如何通过工具学习和记忆优化拓展任务边界,为代理赋能以应对更高复杂度的现实任务。
与此同时,文献还探讨了基础代理在隐私保护、协作机制及安全交互中的必要性,为这一领域的未来研究指明了方向。
该研究团队由国际顶尖学术机构与科技企业的研究者和技术专家组成,拥有横跨多个领域的专业背景。团队合作推动了基础代理领域的探索,结合脑启发智能、协作机制和安全系统的最新进展,为人工智能的未来奠定了坚实基础。
团队中的核心成员来自多所世界级研究机构:蒙特利尔大学与Mila - 魁北克AI研究所是团队的关键力量,这两者不仅专注于脑启发智能技术,还在人工智能理论和应用研究方面具有深远的国际影响力。研究团队在全球范围内拥有强大的支持,聚集了来自如香港科技大学、悉尼大学、宾夕法尼亚州立大学和斯坦福大学等知名学府的专家。在科研探索中,他们各自专注于多模态系统、工具学习、强化学习以及安全机制等关键领域,为该研究注入了跨学科的深度。
除此之外,团队还与包括Google DeepMind、微软亚洲研究院和Argonne国家实验室在内的多家国际科技企业及科研机构合作。工业界与学术界的这种深度协作使团队能够充分结合理论与应用需求,从而在科学探索与实际部署间建立桥梁。例如,Argonne国家实验室聚焦高效工具学习,Google DeepMind则贡献了认知智能与深度学习领域的前沿技术。
研究团队不但在区域上具有高度的多样性,其成员更是在方法和视野上具有开创性,充分体现了全球化的学术协作力量。加拿大CIFAR AI研究主席Bang Liu、MetaGPT平台的开发者以及各领域的学者从基础理论到实践算法,为解决人工智能的复杂挑战提供了一体化的解决方案。通过整合数字环境中的先进模型与现实物理世界的复杂应用,这支团队展现了基础代理技术的巨大潜力与实际价值。
一、智能代理系统的概览
基础代理的概念
基础代理(Foundation Agents)是什么?它不仅仅是人工智能领域的一个技术概念,更是整个智能系统发展的一个里程碑。基础代理可以被定义为一种基于高效感知、智能决策和自动执行的自主系统,它通过结合基础模型(如大语言模型LLMs)和行动系统实现对复杂任务的完整解决方案。它们不仅是AI技术的延续,更是智能体迈向全能型助手的重要跳板。
在当前的人工智能生态中,基础代理占据着重要地位。它们以基础模型为大脑,行动系统为手脚,通过感知模块获取环境信息、决策模块制定执行策略、记忆模块存储并优化经验。通过这些能力,基础代理能够从一个单纯的被动响应器,转变为能主动参与复杂流程、预判用户需求并提供跨领域解决方案的智能体。无论是自动驾驶的实时决策,还是虚拟助手在多模态场景中的交互,它们都体现了基础代理作为“智能催化剂”的强大潜能。
图1.2:我们描述智能代理循环和代理社会的一般框架概述。
核心组件及架构
从结构上看,基础代理的架构可分为四个核心组件,它们紧密协作,共同构建出一个高效、鲁棒的智能体系统:
1.感知系统 感知系统是智能代理与环境互动的入口。它负责通过各种传感器捕获多模态信息——包括文本、图像、音频,甚至物理信号,将这些数据转化为可处理的数字信号。以基础模型为核心,感知系统利用先进的算法(如BERT、ResNet和ViViT等)构建信息的深度语义理解,为后续的决策和执行提供重要依据。
2.行动系统 行动系统是智能代理的“大脑与肌肉”,负责执行具体的任务。它由行动空间、行动学习和工具整合组成:
- 行动空间:定义了智能代理在特定环境中的可执行操作范围,从离散指令到连续动作。
- 行动学习:通过监督训练、上下文学习及强化学习优化行为策略,使系统更加适应动态环境。
- 工具整合:行动系统能够调用外部工具完成复杂任务,这为基础代理从被动响应走向主动决策提供了关键支持。
3.记忆模块 记忆模块是智能代理的“知识库”,存储历史数据、任务经验和学习模式。这种模块不仅能够增强实时任务的执行效率,还能通过长期记忆优化对复杂场景的预测。
4.工具系统 工具系统作为核心组件的延伸,赋予智能代理“手段的能力”。它可以包括API接口、机械手臂、搜索引擎等外部工具,使代理能够在数字与物理环境中展开高效操作。
基础模型与行动系统之间的互动关系
基础代理的智能表现离不开基础模型和行动系统的无缝协作。基础模型,如GPT系列,侧重于理解与生成多模态信息,而行动系统则将这些理解转化为具体执行——形成一个闭环流程:
- 信息输入:基础模型首先通过感知系统处理输入信息,如文本指令或视觉数据。
- 行动选择:行动系统依据感知生成的语义信息,筛选最优行动方案(如调用工具、分解任务)。
- 执行与反馈:执行结果再返回到基础模型进行评估,从而不断优化决策策略。
这种动态循环不仅提升了任务解决的精准度,还扩展了基础代理的任务边界。从语言生成到机器人操控,再到跨模态工具使用,基础代理的“认知与执行闭环”逐渐打破人工智能的固有局限。
二、感知系统解读
人类感知与AI感知的比较
感知是人类与环境互动的第一步,也是智能系统实现任务的基础能力。人类感知是自然进化的奇迹,而AI感知则是科技发展的结晶。尽管它们的运作原理截然不同,但对信息的获取和处理却有着相同的目标:理解世界并做出恰当反应。
1.人类感知的多样性 人类的感知能力远超经典五感(视觉、听觉、味觉、嗅觉、触觉)。现代科学还确认了平衡觉(维持身体平衡)、本体觉(感知身体位置)、温觉(感知温度)和痛觉等扩展感知能力。这些能力通过神经系统实现无缝整合,形成对环境的连续、动态理解。例如,当人类站立时,本体觉和视觉共同作用,帮助我们保持稳定;而当面临紧急情况时,感觉和运动控制会迅速协调,促成即时反应。
2.AI感知的特点与限制 相较于人类,AI感知完全依赖于传感器和算法。摄像头、麦克风和其他传感器将环境信号转化为数字数据,再通过深度学习模型(如ResNet或BERT)解读这些输入。
- 核心差异:人类感知是连续的、多模态融合的,而AI感知通常是离散的、依赖独立传感器的。
- 难点:AI需要通过设计复杂的融合算法,将独立模态信息整合为统一的环境表示。这种离散性限制了AI对动态环境的实时适应性。
感知表示类型及其方法
基础代理中感知系统的设计借鉴了人类感知的模式,结合单模态、跨模态和多模态技术,逐步提升对环境的感知与理解。
1.单模态模型 单模态模型专注于单一感知形式(如文本、图像或音频)的处理,其技术发展重点在于特定信息的深度挖掘:
- 文本:从早期的词袋模型到BERT,通过大规模语料库预训练实现语言深度语义分析,为自然语言处理奠定了基础。
- 图像:ResNet和DETR等模型在视觉特征提取和目标检测上表现卓越,尤其在复杂场景识别方面取得了革命性进展。
- 音频:Wav2Vec2等技术有效降低了语音识别对标注数据量的依赖,实现了自然语音到文本的高效转化。
2.跨模态模型 跨模态模型旨在打破感知模态间的隔阂,实现多模态之间的对齐、生成与转换:
- 文本-图像:CLIP通过对比学习实现了文本与图像的零样本检索,DALL·E则展现了将文本描述转化为高质量图像的能力。
- 文本-视频:VideoCLIP提取视频帧特征并与语言表示对齐,支持视频内容的语义理解与搜索。
- 文本-音频:音频与文本的结合拓展了感知系统在语音合成与多语言翻译中的应用。
3.多模态模型 多模态模型通过整合多种感知信息,生成具有全局语义的统一表示:
- LLaVA:首次结合语言与图像多模态输入,展示出强大的交互式对话能力。
- Video-ChatGPT:进一步延伸到视频输入,使代理能够感知时间维度的动态变化。
- HuggingGPT:整合视觉、音频与文本专家模型,为复杂多模态任务提供了一站式解决方案。
实际案例与应用
感知模块为智能代理赋予环境理解的能力,使其在多场景应用中展现出巨大潜力:
1.虚拟助手:通过文本和音频感知,智能语音助手能够捕捉用户指令并提供上下文敏感的回答。
2.机器人导航:多模态感知模型(如CLIP+视觉专家)使机器人能够识别复杂路径并避开障碍物。
3.医疗领域:音频分析与影像识别结合的模型正在推动远程诊断与手术辅助系统的发展。
三、行动系统解析
在探讨智能代理如何高效行动之前,了解人类行动系统的结构和运行逻辑是不可或缺的。这不仅为AI设计提供了灵感,也帮助我们更好地理解行动与感知之间的复杂关系。无论是人类的心理行为还是物理行为,它们都通过一系列循环反馈形成了认知闭环,这一机制为AI代理的行动系统开发提供了强有力的参考。
人类行为系统启示
在人类认知中,行动系统可以被分为两大类别:心理行为和物理行为。前者是思想的驱动器,后者是外部动作的执行者。心理行为包括推理、规划、反思和想象等。它们是隐藏在决策背后的力量,帮助个体分析情况并预设未来可能的结果。这些思维活动就像行动的信号源,通过理性和逻辑主导大脑的选择。
另一方面,物理行为是心理行为的外化表现,比如说话、奔跑、操控工具,甚至是一个简单的手势。这些动作需要依赖复杂的神经网络协调肌肉和感觉器官,在连续反馈的支持下实现精准控制。举例来说,当人类用双手拼装家具时,眼睛提供视觉反馈,而大脑迅速调整动作以适应现实情况。心理和物理行为通过感知-行动-反馈的循环构建了认知闭环——一个不断调整与优化的动态系统。
这种认知闭环的启示对AI代理的设计尤为重要。通过模仿人类心理行为的深度推理和物理行为的精确执行,AI可以实现更自然、更高效的任务完成方式。比如,在复杂任务场景中,AI代理需要能像人类一样,主动探索、快速适应,并基于反馈调整策略。
AI代理中的行动系统
构建一个高效的AI行动系统,首先要明确其行动空间、行动学习范式和工具整合的机制。这些要素共同决定了智能代理的决策灵活性和操作能力。
行动空间:从语言到物理领域的多维场景 行动空间定义了AI代理可以选择的所有可能行为。从离散到连续,从简单到复杂,行动空间的设计关乎任务的最终执行效果。在语言驱动的环境中,基础模型(如InstructGPT)解析用户的语义输入并转化为可操作的指令;而在数字任务中,如网页代理或移动设备助手,代理通过GUI操作或调用API完成多步骤任务。在物理场景下,行动空间扩展至机器人操作,比如RT-2通过视觉-语言系统指导机器手臂完成精准动作。更高阶的科学任务场景(如ChemCrow或SciAgent)则要求代理能整合跨领域工具,在化学设计或材料研究中展示专业级能力。
行动学习:从被动理解到主动优化 AI代理的行动学习依赖多种范式的深度协作。上下文学习(如Chain-of-Thought)无需模型调整,仅凭提示便可实现动态推理。监督训练通过大规模数据的预训练和微调,帮助模型在新任务中表现出色。例如,GR-2结合视频和机器人数据学习动态世界的行为模式。而强化学习(如RLHF)则通过反馈信号和奖惩机制,优化代理的长期策略,如Eureka通过反思机制生成奖励,帮助机器人完成五指操控任务。每一种范式都有其独特的适用场景和优势,在复杂任务中可以相互补充,最终实现系统的全面优化。
工具整合:打造超级助手 工具学习是行动系统中的亮点之一。它让智能代理不仅停留在分析和计划层面,还能通过实际的操作完成任务。工具学习包括三大组成:发现、创建和使用。工具发现涉及如何有效检索或生成满足需求的工具,例如ToolFormer通过训练模型生成对应API调用。工具创建则依赖LLM生成代码并提供验证机制,确保新工具的可靠性与适用性。而工具使用则强调如何结合领域知识,深度整合专业化工具。例如,在数字领域,代理通过API调用实现内容生成;在物理领域,机器人通过传感器和控制器完成细致动作;而在科学领域,多工具协同的整合能力为复杂研究提供了强有力支持。
行动与感知的关系
行动与感知的关系可以用“外部驱动”和“内部驱动”两种视角来理解。外部驱动认为感知刺激是行动的起点,智能代理被动响应环境变化。这种模式限制了系统的主动性,使其更像一台复杂的机器。而内部驱动则颠覆了传统逻辑,强调由行动产生的预测信号反过来校准感知输入。这一视角赋予代理主动性,让它可以通过自发行为减少感知的不确定性。
这种基于主动性的行动驱动感知模式,不仅提高了系统的效率,也为复杂任务提供了更多可能。例如,一个代理在视觉任务中自发生成问题,通过提问或探索验证假设,从而减少错误推断。这种自发行动增强了数据效率和学习能力,使代理能够更快适应动态环境。
四、强化学习和工具整合在行动中的应用
人工智能的行动系统,尤其是基础代理的发展,依托于强化学习和工具整合的深度耦合。两者不仅推动智能体从被动反应型向主动学习型进化,还赋予了其应对复杂任务、适应多领域场景的能力。强化学习作为优化智能决策的核心路径,帮助代理在动态环境中逐步改进行为策略;而工具系统则通过多样化的外部资源扩展了代理的能力边界。这种结合使基础代理在现实场景中展现出强大的适用性。
强化学习在行动系统中的作用
强化学习的意义在于,它为智能代理提供了一种自我调整和优化决策的机制,能够通过与环境的持续交互,学会如何实现目标。经典算法如DQN(深度Q网络)和PPO(近端策略优化)奠定了这一领域的基础。DQN以其高效的离散任务优化能力广泛应用,而PPO则凭借其更稳定的训练特性,在处理复杂的连续动作空间任务中表现出色。
然而,当基础代理从简单的游戏领域向更复杂的多模态任务延展时,强化学习也进入了新的进化阶段。例如,RLHF(基于人类反馈的强化学习)在InstructGPT中得到了精彩展示:通过整合人类反馈训练奖励模型,AI的文本输出更加符合人类偏好,而非单纯依赖数据分布进行推理。分层强化学习进一步推动了复杂任务的分解与解决,通过高层规划生成行动框架,而低层策略则细化具体执行步骤,实现任务的层次化优化。
以实际案例为基础的研究更进一步展示了强化学习的可能性。例如,RLFP结合策略与价值模型,通过对任务的高效探索显著提升了代理的学习能力;ELLm利用LLM(大语言模型)的知识背景引导代理探索未知环境,极大提高了复杂环境中的决策效率;GenSim则通过自动生成模拟环境和专家示例,为自由探索提供了数据和规则支持。LEA、MLAQ和KALM等案例展示了通过强化学习策略优化推荐系统、模拟轨迹以及动作选择的突破性进展。这些实例无一不说明,强化学习已成为行动系统不可或缺的一部分,为智能代理在多领域复杂任务中的表现提供了技术支柱。
工具系统与行动系统的融合
如果说强化学习解决了“怎么学”,那么工具整合则回答了“用什么”的问题。对于基础代理而言,工具系统的意义在于扩展行动系统的触角,使其能够在数字、物理乃至科学领域执行更加复杂和专业的任务。数字领域的应用尤其广泛,例如HuggingGPT通过调用平台上的多模态模型,分析用户需求并选择最佳工具。WebGPT和Mobile-Agent将工具整合应用于网络搜索、GUI操作和移动任务管理,展现出灵活而强大的问题解决能力。
物理领域的挑战更为复杂,例如TidyBot通过LLM学习个性化清洁工具的使用策略,以适应用户需求;RT-2结合视觉和语言工具,成功引导机器人完成操作任务;而在自动驾驶领域,基础代理更是通过集成车辆控制工具和视觉-语言模型,实现了解释性更强的自动驾驶导航系统。
科学任务中,工具整合的突破同样引人注目。ChemCrow整合了18种化学工具,从有机合成到药物设计无所不包;SciToolAgent通过超500种工具的协同作用,为材料科学和天体物理等复杂研究领域提供了解决方案。
而这些成功的案例背后,离不开工具学习技术的支持。工具发现作为第一步,既包括基于检索的方法,如HuggingGPT从工具库中选择最相关工具;也包括生成方法,例如ToolFormer通过训练模型生成API调用并自动匹配工具需求。工具创建则通过LLM生成代码和验证机制实现新工具的开发和优化,如PAL和Creator等框架。最后,工具使用涉及纵向专业化(面向特定领域任务的工具深度应用)、横向整合(多模态工具协作)以及体感交互(机器人工具与传感器结合实现任务)的拓展。
在这些技术实现的基础上,基础模型与工具系统之间的平衡成为关键课题。模型的强大内在能力允许它处理语言生成和知识推理,但工具系统的灵活性为任务执行带来了更加具体和专业的可能性。例如,在科学研究中,工具系统能够通过复杂的数据分析和自动化流程解决难题,而模型则通过语义理解和推理提供理论支撑。两者的结合为基础代理实现跨领域的高效任务执行提供了技术保障。
五、挑战与未来方向
面对智能代理的飞速发展,技术进步如同攀登高峰,既充满潜能又布满荆棘。实现智能代理的全面进化并融入现实世界,涉及多个领域的挑战,这些挑战不仅关乎效率与可靠性,更考验其能否跨越语言的局限、保障隐私与安全,甚至在基础模型与工具系统间找到完美的平衡。
效率挑战:追求实时性能的艺术
在自动驾驶、欺诈检测等实时任务中,代理需要以毫秒为单位进行响应。然而,行动系统的复杂性、数据冗余以及推理流程中的瓶颈常常导致计算延迟。这种迟滞不仅降低了系统的表现,也限制了其实际应用的范围。
解决这一难题的关键在于优化任务的执行路径。通过数据过滤技术剔除冗余信息,为智能代理减负;零样本提示技术则精简了任务推理,使决策路径更加直接;高速存储方案的使用更进一步缩短响应时间,为动态环境中的高频交互提供了强有力的支持。这些方法不仅在性能上带来突破,更为基础代理迈向实时化任务铺平了道路。
评估与可靠性:打造可信赖的智能助手
智能代理的行为是否准确可靠,直接决定了用户对其信任的深度。在多源数据环境中,工具与动作选择的正确性往往受到信息冲突的挑战;代理还可能因幻觉生成无意义或错误的结果,使系统的表现变得不稳定。
因此,建立一种稳健的评估体系显得尤为重要。通过设计细致的验证协议,智能代理能更好地协调不同工具的协作,并通过透明化的决策过程减少错误输出。这不仅有助于提高工具与行为选择的精准度,还能增强用户对系统的信任感,将智能代理塑造为真正可依赖的助手。
多模态与跨领域行动:破除语言限制的挑战
人类能够通过语言、视觉、音频以及身体动作灵活地学习新技能,而当下的智能代理仍大多局限于语言指令。在现实场景中,单模态的任务处理能力已不能满足需求,代理需要整合多模态能力以实现突破。
一个代理不仅可以听懂语言指令,还能通过视频内容理解动态场景,再通过物理操作完成任务——这将大大拓宽智能系统的应用边界。发展基于视觉和语音的整合技术,探索通过传感器数据学习技能的动态模型,智能代理在多模态交互中正积蓄着巨大的潜能,为解决复杂问题创造无限可能。
隐私与安全问题:数据保护与伦理保障
随着生成式AI逐步融入日常生活,数据隐私和安全问题成为不可忽视的焦点。用户信息的泄露或滥用,不仅威胁了安全性,还可能引发道德风险。
为此,联邦学习技术的引入至关重要,它允许代理在分布式数据上进行训练,无需直接暴露用户信息;而模型蒸馏的应用则在保护敏感数据的同时确保系统性能。此外,伦理准则和安全机制的建立是智能代理与用户之间的信任纽带,能够有效防止代理因错误或恶意行为对物理环境造成危害。
基础模型与工具系统的平衡:智力与手段的协奏曲
基础模型的强大内在能力是智能代理的核心,而工具系统的灵活性则赋予其实现复杂任务的途径。两者之间如何找到平衡,不仅决定了系统的效率,还关乎智能代理是否能够在现实任务中游刃有余。
这一平衡的探索包括何时调用外部工具,何时依赖模型的自主能力,以及如何协调两者以发挥最大效能。例如,在药物研发等科学任务中,工具系统可以提供精准的数据分析,但模型的语义理解能力则是有效整合资源的关键。通过协同工具与模型的能力,智能代理才能在复杂场景中表现得更加智能与高效。
六、结论
从人类认知的灵感到人工智能的应用,基础代理已经展现了它的技术力量。在这篇文献中,感知、行动、记忆和工具整合的核心组件被系统性地分析,它们共同构成了智能代理的骨架与灵魂。通过这些组件的协同运作,基础代理不仅能够理解用户需求,还能在复杂任务中施展卓越能力,展现自主、协作与安全的强大潜力。
行动系统是基础代理的“能量源”,它赋予智能代理一种由内而外的主动性,而工具整合则是其“能力拓展器”,打开了外部资源的大门。从单一模态到跨模态,从语言交互到机器人操控,基础代理正以迅猛的速度在现实世界中寻求突破。它们不再是简单的任务完成器,而是逐渐变成具备预测、调整和学习能力的综合型助手。通过感知与行动的闭环优化,结合工具学习的深化,基础代理从理论模型走向现实应用,为解决动态环境中的复杂问题提供了可信赖的解决方案。
但这仅仅是个开始。正如文献所揭示的那样,基础代理的真正潜力仍然有待挖掘。随着技术的迭代,这些系统将进一步迈向未知领域,变得更加智能、更加贴合实际需求。
展望未来,研究重点将集中于几大方向。首先是自适应神经架构的突破。随着环境复杂性和任务难度的增加,智能代理需要能够自主调整结构的能力,以满足实时变化的需求。这不仅是技术的一场革新,更是AI系统智能化的象征。跨模态对齐方法也将成为另一个关键领域,如何高效地整合不同模态的信息,形成统一的语义图景,将为数据复杂性带来解决之道。而分层强化学习则提供了应对动态任务的思路,通过高层规划与低层执行的协作,智能代理能够在复杂情境中找寻最佳策略。
此外,工具系统的创新将继续推动科学探索与工业应用。无论是自动化工程,还是尖端领域的药物开发,整合专业工具的智能代理都将发挥不可替代的作用。而隐私保护与安全机制的进一步完善,则是保障这些系统能够被广泛采用的基石。从联邦学习到伦理规范,每一项技术都旨在确保人类与机器的协作安全、尊重且富有成效。
基础代理的未来不仅是技术发展的故事,更是一场关于人类智慧如何与机器共生的深刻探索。从脑启发到工具整合,从协作到安全,智能代理的演化将为人类社会的方方面面带来深远影响。随着这些研究方向的推进,我们站在了新智能时代的黎明之上,也正在为它的到来做好准备。
参考资料:https://arxiv.org/pdf/2504.01990
本文转载自独角噬元兽,作者:FlerkenS
