AgenticAI、AIAgents和Agents这三个词频繁出现在各大自媒体上。上周和朋友讨论时,我们发现很容易把这三个术语混为一谈。乍看之下,它们很相似,但它们并不可互换。但是可能理解他们的区别,似乎也并不重要,当一个事情所有人都模糊的时候,那就都是对的。从目前来看,真正的AgentAgentic产品,似乎在摆脱Agent的概念。比如说,AI编程、AI研究...过度强调Agent概念可能会让用户产生过高期待,而且堆砌高端的词汇会拉远用户与产...
继谷歌、OpenAI和Perplexity相继发布各自的DeepResearch后,牛津大学发布了一个“AgenticReasoning:ReasoningLLMswithToolsfortheDeepResearch”的工作,并且代码开源了,今天咱们来详细看看他们的deepresearch的玩法!这个框架,不仅在PhD级别的科学推理测试(GPQA)上超越了现有的RAG系统和闭源大模型,而且在金融、医疗和法律等领域的深度研究任务中,击败了谷歌的GeminiDeepResearch!为什么能做到这一点普通的推理模型只能依...
2025-02-25 13:17:01 462浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道DeepSeek刚刚又发补给了,补给4件套。包含2个配置项,不要设置systemprompt+temperature设置为0.6。还有大家比较期待的官网的,接入搜索的R1的prompt设计及最佳用法!以及如何缓解R1系列模型绕过思考的解决办法。在DeepSeek官网版本,没有使用系统提示词,而是为文件上传和网络搜索设计了两个特定的提示词以获得更好的用户体验。并且temperature设置为0.6。对于文件上传,请按照模板...
2025-02-17 09:36:35 450浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道早上,OpenAI又在折腾了,现在o3mini支持思维链可视了!当然能看到的,既不是原始思维链的赤裸展示,也不再是完全的黑箱操作。图片有限透明的技术妥协o3mini的思维链展示并非实时思维流,而是经过三重过滤的精致产物:安全审查层:自动剔除涉及伦理争议的推理片段(如怎么做炸药)复杂性蒸馏:将数学证明过程压缩为步骤大纲,保留结论但隐去关键参数多语言转换:非英语用户的思维链...
2025-02-07 13:30:28 385浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道今天给家人们聊一期播客总结,四十二章经最新一期播客请到了在Meta工作了七年的应用强化学习组负责人朱哲清Bill。作为斯坦福大学强化学习专业博士,现在创业做Agent的他,抛出了一个巨大的反共识观点:"LLM只是一个翻译官,真正的Agent核心应该是RL。"等等,这是什么意思?在2024年,我们见证了GPT4掀起的Agent热潮。Claude、GPTs、Copilot...几乎所有大公司都在用LLM构建Agent。但B...
2025-01-23 09:19:13 692浏览 0点赞 0回复 1收藏
今天给家人们分享一下AgentLess,这个舆论比较高的研究工作。。AGENTLESS:DemystifyingLLMbasedSoftwareEngineeringAgentsAI编程在最近几个月非常火热,像Devin这种自主Agent,已经可以完成端到端的软件开发任务。最新的Agent基本具备了使用工具、执行命令、观察环境反馈并规划下一步行动的能力。但是,这些基于Agent的方法往往非常复杂,而且当前LLM的能力也存在局限性。这就引出了一个问题:我们真的需要如此复杂的自主Agent...
2025-01-14 12:57:53 447浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道AI的“知识焦虑”很多时候,即使是最强大的AI模型,在面对复杂问题时也会显得力不从心?它们仿佛拥有惊人的记忆力,却无法真正理解知识背后的逻辑和关联。这就像一个学霸,背诵了无数知识点,却难以灵活运用。原因在于,传统的AI模型(例如大模型)处理信息的方式,通常是将数据视为孤立的个体。它们无法像人类一样,自然而然地捕捉到数据之间的关系,而这种关系正是理解知识的关键...
2025-01-06 11:08:03 937浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道在a16z预测2025年的发展中,Agent占据了很重要的一个环节。昨天中金也发研报,表示看好Agent的发展趋势。包括langchain发布的24年总结报告,Agent是持续保持增长的。所以25年,Agent或许值得期待?今天给家人们完全梳理一下Agent智能体的系统,作为Agent入门指南(超长超长)!这篇文章会帮你理清头绪,明确地告诉你智能体到底是什么,以及它们是怎么工作的。我们会拆解智能体的关键...
2024-12-26 13:11:27 917浏览 0点赞 0回复 0收藏
AI编程,下半年火遍全网,最近的Devin,以500美刀M的价格杀疯了,早上openai2000刀订阅的新闻也传遍了各个微信群。cursor、windsurf、bold.new都逐渐的进入了实用的阶段,未来对AI说“帮我写个微信”这种需求,似乎也不太遥远。今天给家人们分享的是AI编程赛道的独角兽,Replit。背景早期流行的,如githubcopilot,国产的通义灵码这些AI编程产品,在代码补全和增量开发方面表现出色,所以获得了比较大的市场。但是短期来看,AI...
2024-12-17 13:15:42 642浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道!LlamaAgents和LangGraph,这两个框架分别由llamaIndex团队和langchain团队开源,都是人工智能领域的热门框架。首先看LlamaAgents的流程图如下:在LlamaAgents中,用户可以直接与controlplane交互,控制平面由一个协调器和一系列服务元数据组成。协调器负责决定下一步会发生什么,显示出动态决策的能力。服务元数据则负责维护服务的元信息,确保信息的适当管理和检索。LlamaAgents...
2024-12-13 14:06:23 874浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道!今天分享一个针对RAG噪声的综述,中文标题为:潘多拉魔盒还是阿拉丁神灯:揭示RAG噪声在大型语言模型中作用的综合分析Pandora’sBoxorAladdin’sLamp:AComprehensiveAnalysisRevealingtheRoleofRAGNoiseinLargeLanguageModels检索增强生成(RAG)已成为解决大型语言模型(LLMs)幻觉问题的关键方法。尽管近期研究已将RAG模型扩展到复杂的噪声场景中,但这些探索往往局限于有限的噪...
2024-12-06 07:19:18 739浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道今天给大家分享一个新研究,前顶会AAAI主席SubbaraoKambhampati发布的论文。能够规划一系列行动以实现预期目标,长期以来被认为是智能体的核心能力之一,并自人工智能研究之初便成为其不可或缺的一部分。随着大型语言模型(LLMs)的出现,关于它们是否具备这种规划能力的问题引起了广泛关注。我们于2022年开发的可扩展基准测试PlanBench,紧随GPT3的发布推出,至今仍是评估LLMs规划...
2024-11-28 15:27:46 716浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道今天给家人们分享一些智能体应用的目前的一些好的消息。今年在AI开发工具领域有一个逐渐兴起的观点:具有更好"AI计算机交互接口"的工具,将有比较大希望能解决AIAgent的可靠性和准确性问题。目前这种趋势已经在多个产品中体现出来,比如E2B平台(https:github.come2bdevE2B),以及由JeremyHoward发起、现在被Anthropic采用的llms.txt文档规范。最新Vercel也推出了一个通用的A...
2024-11-21 14:02:46 810浏览 0点赞 0回复 0收藏
近期,微软推出了一款创新性的通用MultiAgent框架——MagenticOne。这个开源项目致力于处理各类复杂的开放性任务,涵盖范围包括网络浏览操作、本地文件管理、Python代码编写与执行、市场研究分析以及学术论文撰写等多个方面。该框架由五个核心智能体构成:总体协调的Orchestrator、负责网络任务的WebSurfer、管理文件系统的FileSurfer、专注编程的Coder,以及处理终端操作的ComputerTerminal。在这个体系中,Orchestrator作为核...
2024-11-14 15:54:56 1158浏览 0点赞 0回复 0收藏
在与用户进行自然对话交互时,智能体需要完成两个核心任务:一是进行对话交流,二是执行推理与规划。智能体在对话过程中,需要综合利用所有可获取的信息来做出回应,同时其行为要始终围绕目标展开。这种对话交互与多步推理规划的双重模式,与卡尼曼所描述的人类快速和缓慢思维系统颇为相似。基于这一理念,DeepMind团队开发了一个双系统框架,称为TalkerReasoner,旨在模仿人类的这两种思维模式。为了实现智能体与用户之间的自...
2024-11-08 15:02:46 830浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道!今天我要跟大家分享一个超级棒的开源工具——Crawl4AI。这个工具简直是构建AIAgent的福音,它自动化了网页爬取和数据提取的过程,让开发者们能更高效地构建智能Agent来收集和分析信息。首先,Crawl4AI是完全开源且免费的,这意味着开发者们可以无门槛地使用它。它的核心亮点是AI驱动,能够自动识别和解析网页元素,大大节省了我们的时间和精力。而且,Crawl4AI还能将提取的数据转...
2024-11-04 11:51:41 2162浏览 0点赞 0回复 0收藏
ToolGen:UnifiedToolRetrievalandCallingviaGeneration随着大型语言模型(LLMs)的发展,它们无法与外部工具直接交互以自主执行任务,这仍然是一个关键的限制。传统方法依赖于将工具描述作为上下文进行输入,这受到上下文长度的限制,并且需要单独的、通常效率不高的检索机制。我们引入了ToolGen,这是一种范式转变,通过将每个工具表示为唯一的token,直接将工具知识集成到LLM的参数中。这使得LLM能够生成工具调用和参数作为其...
2024-10-30 14:09:28 815浏览 0点赞 0回复 0收藏
今天我们来聊聊一个超酷的东西——使用AutoGPT创建的智能Agent。想象一下,你有一个庞大的在线商城数据库,里面存储了海量的用户和交易数据。你想知道有多少活跃用户?一个AutoGPTAgent就能帮你秒查出来,而且,它还能写出正确的SQL查询,不会出错的那种。首先,我们需要给AutoGPT准备一个“大脑”,也就是向量存储,用来保存它的记忆。然后,我们还需要定义一些工具,让Agent知道如何执行SQL查询、获取表结构等。代码大致长这...
2024-10-24 15:05:55 989浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道!今天开始我们来详细看看智能体的大脑——记忆模块的内部,主要从三个方面来扒一扒:记忆从哪儿来,记忆长啥样,以及怎么用记忆。今天我们主要聊聊记忆来源这个话题!首先,我们得明白,记忆对Agent来说,就像是它们的知识库和经验集,能让它们在处理任务时更加得心应手。记忆来源,就是指智能体记忆内容的出处。这里,我们主要关注三种类型的记忆来源:内部任务信息(InsidetrialI...
2024-10-21 13:34:31 1777浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道小长假结束了,今天给家人们分享一下假期开源的一个Agent设计模式图,图画的很漂亮。热度蛮高的,然后还有大佬开源了配套的tutorialgithub项目。Agentic设计模式常见的有4种基于reflection的,纯粹的对结果反思,无外部交互。这是一个非常基础的模式,尽管很简单,但却可以为结果带来挺大的提升。与工具交互,并对交互结果进行推理。LLM中存储的信息通常不足以准确、有见地地回答问...
2024-10-15 14:21:33 1037浏览 0点赞 0回复 0收藏