回复
微软五大Agent联手,这下厉害了!
近期,微软推出了一款创新性的通用Multi-Agent框架——Magentic-One。这个开源项目致力于处理各类复杂的开放性任务,涵盖范围包括网络浏览操作、本地文件管理、Python代码编写与执行、市场研究分析以及学术论文撰写等多个方面。
该框架由五个核心智能体构成:总体协调的Orchestrator、负责网络任务的WebSurfer、管理文件系统的FileSurfer、专注编程的Coder,以及处理终端操作的ComputerTerminal。在这个体系中,Orchestrator作为核心智能体,承担着任务规划、进度监控和错误修正等重要职责。
从运作机制来看,Magentic-One采用了双循环结构:外循环负责管理任务账本,记录事实、推测和计划;内循环则专注于进度账本的维护,包括当前进度状态和任务分配情况。
各智能体的具体职能如下:
- Orchestrator担任总指挥角色,负责任务拆解、规划和协调其他智能体
- WebSurfer专门处理基于Chromium的浏览器操作,能够执行网页导航、交互和内容解析
- FileSurfer主要负责Markdown格式的文件处理和目录管理
- Coder着重于代码编写和信息分析
- ComputerTerminal提供控制台访问权限,支持程序执行和库安装
在性能评测方面,Magentic-One在GAIA和AssistantBench等测试平台上展现出与现有顶级方案相当的表现,并在WebArena测试中取得了具有竞争力的成绩。
- 官方博客:https://www.microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks/
- 项目地址:https://github.com/microsoft/autogen/tree/main/python/packages/autogen-magentic-one
本文转载自 探索AGI,作者: 猕猴桃
赞
收藏
回复
相关推荐