探索AGI
LV.3
专注于大模型agent的产品落地方向
声望 367
关注 0
粉丝 2
私信
主帖 37
回帖
嘿,大家好!这里是一个专注于AI智能体的频道今天给家人们聊一期播客总结,四十二章经最新一期播客请到了在Meta工作了七年的应用强化学习组负责人朱哲清Bill。作为斯坦福大学强化学习专业博士,现在创业做Agent的他,抛出了一个巨大的反共识观点:"LLM只是一个翻译官,真正的Agent核心应该是RL。"等等,这是什么意思?在2024年,我们见证了GPT4掀起的Agent热潮。Claude、GPTs、Copilot...几乎所有大公司都在用LLM构建Agent。但B...
2025-01-23 09:19:13 246浏览 0点赞 0回复 1收藏
今天给家人们分享一下AgentLess,这个舆论比较高的研究工作。。AGENTLESS:DemystifyingLLMbasedSoftwareEngineeringAgentsAI编程在最近几个月非常火热,像Devin这种自主Agent,已经可以完成端到端的软件开发任务。最新的Agent基本具备了使用工具、执行命令、观察环境反馈并规划下一步行动的能力。但是,这些基于Agent的方法往往非常复杂,而且当前LLM的能力也存在局限性。这就引出了一个问题:我们真的需要如此复杂的自主Agent...
2025-01-14 12:57:53 164浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道AI的“知识焦虑”很多时候,即使是最强大的AI模型,在面对复杂问题时也会显得力不从心?它们仿佛拥有惊人的记忆力,却无法真正理解知识背后的逻辑和关联。这就像一个学霸,背诵了无数知识点,却难以灵活运用。原因在于,传统的AI模型(例如大模型)处理信息的方式,通常是将数据视为孤立的个体。它们无法像人类一样,自然而然地捕捉到数据之间的关系,而这种关系正是理解知识的关键...
2025-01-06 11:08:03 559浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道在a16z预测2025年的发展中,Agent占据了很重要的一个环节。昨天中金也发研报,表示看好Agent的发展趋势。包括langchain发布的24年总结报告,Agent是持续保持增长的。所以25年,Agent或许值得期待?今天给家人们完全梳理一下Agent智能体的系统,作为Agent入门指南(超长超长)!这篇文章会帮你理清头绪,明确地告诉你智能体到底是什么,以及它们是怎么工作的。我们会拆解智能体的关键...
2024-12-26 13:11:27 658浏览 0点赞 0回复 0收藏
AI编程,下半年火遍全网,最近的Devin,以500美刀M的价格杀疯了,早上openai2000刀订阅的新闻也传遍了各个微信群。cursor、windsurf、bold.new都逐渐的进入了实用的阶段,未来对AI说“帮我写个微信”这种需求,似乎也不太遥远。今天给家人们分享的是AI编程赛道的独角兽,Replit。背景早期流行的,如githubcopilot,国产的通义灵码这些AI编程产品,在代码补全和增量开发方面表现出色,所以获得了比较大的市场。但是短期来看,AI...
2024-12-17 13:15:42 423浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道!LlamaAgents和LangGraph,这两个框架分别由llamaIndex团队和langchain团队开源,都是人工智能领域的热门框架。首先看LlamaAgents的流程图如下:在LlamaAgents中,用户可以直接与controlplane交互,控制平面由一个协调器和一系列服务元数据组成。协调器负责决定下一步会发生什么,显示出动态决策的能力。服务元数据则负责维护服务的元信息,确保信息的适当管理和检索。LlamaAgents...
2024-12-13 14:06:23 569浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道!今天分享一个针对RAG噪声的综述,中文标题为:潘多拉魔盒还是阿拉丁神灯:揭示RAG噪声在大型语言模型中作用的综合分析Pandora’sBoxorAladdin’sLamp:AComprehensiveAnalysisRevealingtheRoleofRAGNoiseinLargeLanguageModels检索增强生成(RAG)已成为解决大型语言模型(LLMs)幻觉问题的关键方法。尽管近期研究已将RAG模型扩展到复杂的噪声场景中,但这些探索往往局限于有限的噪...
2024-12-06 07:19:18 445浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道今天给大家分享一个新研究,前顶会AAAI主席SubbaraoKambhampati发布的论文。能够规划一系列行动以实现预期目标,长期以来被认为是智能体的核心能力之一,并自人工智能研究之初便成为其不可或缺的一部分。随着大型语言模型(LLMs)的出现,关于它们是否具备这种规划能力的问题引起了广泛关注。我们于2022年开发的可扩展基准测试PlanBench,紧随GPT3的发布推出,至今仍是评估LLMs规划...
2024-11-28 15:27:46 504浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道今天给家人们分享一些智能体应用的目前的一些好的消息。今年在AI开发工具领域有一个逐渐兴起的观点:具有更好"AI计算机交互接口"的工具,将有比较大希望能解决AIAgent的可靠性和准确性问题。目前这种趋势已经在多个产品中体现出来,比如E2B平台(​​https:github.come2bdevE2B​​),以及由JeremyHoward发起、现在被Anthropic采用的llms.txt文档规范。最新Vercel也推出了一个通用的A...
2024-11-21 14:02:46 598浏览 0点赞 0回复 0收藏
近期,微软推出了一款创新性的通用MultiAgent框架——MagenticOne。这个开源项目致力于处理各类复杂的开放性任务,涵盖范围包括网络浏览操作、本地文件管理、Python代码编写与执行、市场研究分析以及学术论文撰写等多个方面。该框架由五个核心智能体构成:总体协调的Orchestrator、负责网络任务的WebSurfer、管理文件系统的FileSurfer、专注编程的Coder,以及处理终端操作的ComputerTerminal。在这个体系中,Orchestrator作为核...
2024-11-14 15:54:56 868浏览 0点赞 0回复 0收藏
在与用户进行自然对话交互时,智能体需要完成两个核心任务:一是进行对话交流,二是执行推理与规划。智能体在对话过程中,需要综合利用所有可获取的信息来做出回应,同时其行为要始终围绕目标展开。这种对话交互与多步推理规划的双重模式,与卡尼曼所描述的人类快速和缓慢思维系统颇为相似。基于这一理念,DeepMind团队开发了一个双系统框架,称为TalkerReasoner,旨在模仿人类的这两种思维模式。为了实现智能体与用户之间的自...
2024-11-08 15:02:46 637浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道!今天我要跟大家分享一个超级棒的开源工具——Crawl4AI。这个工具简直是构建AIAgent的福音,它自动化了网页爬取和数据提取的过程,让开发者们能更高效地构建智能Agent来收集和分析信息。首先,Crawl4AI是完全开源且免费的,这意味着开发者们可以无门槛地使用它。它的核心亮点是AI驱动,能够自动识别和解析网页元素,大大节省了我们的时间和精力。而且,Crawl4AI还能将提取的数据转...
2024-11-04 11:51:41 1395浏览 0点赞 0回复 0收藏
ToolGen:UnifiedToolRetrievalandCallingviaGeneration随着大型语言模型(LLMs)的发展,它们无法与外部工具直接交互以自主执行任务,这仍然是一个关键的限制。传统方法依赖于将工具描述作为上下文进行输入,这受到上下文长度的限制,并且需要单独的、通常效率不高的检索机制。我们引入了ToolGen,这是一种范式转变,通过将每个工具表示为唯一的token,直接将工具知识集成到LLM的参数中。这使得LLM能够生成工具调用和参数作为其...
2024-10-30 14:09:28 613浏览 0点赞 0回复 0收藏
今天我们来聊聊一个超酷的东西——使用AutoGPT创建的智能Agent。想象一下,你有一个庞大的在线商城数据库,里面存储了海量的用户和交易数据。你想知道有多少活跃用户?一个AutoGPTAgent就能帮你秒查出来,而且,它还能写出正确的SQL查询,不会出错的那种。首先,我们需要给AutoGPT准备一个“大脑”,也就是向量存储,用来保存它的记忆。然后,我们还需要定义一些工具,让Agent知道如何执行SQL查询、获取表结构等。代码大致长这...
2024-10-24 15:05:55 728浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道!今天开始我们来详细看看智能体的大脑——记忆模块的内部,主要从三个方面来扒一扒:记忆从哪儿来,记忆长啥样,以及怎么用记忆。今天我们主要聊聊记忆来源这个话题!首先,我们得明白,记忆对Agent来说,就像是它们的知识库和经验集,能让它们在处理任务时更加得心应手。记忆来源,就是指智能体记忆内容的出处。这里,我们主要关注三种类型的记忆来源:内部任务信息(InsidetrialI...
2024-10-21 13:34:31 1444浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道小长假结束了,今天给家人们分享一下假期开源的一个Agent设计模式图,图画的很漂亮。热度蛮高的,然后还有大佬开源了配套的tutorialgithub项目。Agentic设计模式常见的有4种基于reflection的,纯粹的对结果反思,无外部交互。这是一个非常基础的模式,尽管很简单,但却可以为结果带来挺大的提升。与工具交互,并对交互结果进行推理。LLM中存储的信息通常不足以准确、有见地地回答问...
2024-10-15 14:21:33 780浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道今天给家人们分享一个新RAG技巧,随着LLMs能力的变强,检索整个文档而不是文档块已经逐渐成为RAG的新规范。但是如何从大量文档中找出正确的文档呢?最近akshaypachaar大佬,开源了一个改变游戏规则的方法,它将RAG与结构化查询相结合,以实现精确的文档检索。方法的秘密是:建索引的每个文档块附带上文档的信息执行块搜索,从而可以获取到相关的文档的元数据使用检索到的元数据作为...
2024-10-11 16:16:17 850浏览 0点赞 0回复 0收藏
今天分享这篇很干的文章!通过对RAG系统的用户Query进行难度区分,进而可以将系统划分为4个等级。RetrievalAugmentedGeneration(RAG)andBeyond:AComprehensiveSurveyonHowtoMakeyourLLMsuseExternalDataMoreWisely使用外部数据增强的大型语言模型(LLMs)在完成现实世界任务方面表现出了卓越的能力。外部数据不仅增强了模型的特定领域专业知识和时间相关性,而且还减少了幻觉的发生率,从而增强了输出的可控性和可解释性。将外部...
2024-09-27 14:01:57 1464浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道最近这2篇综述有点撞车了,不是纯正的Agent综述,可以了解一下最新的应用测的Agent发展情况!现实中的Agent系统会面临很多的挑战,常见的有以下几点:感知模块的探索不足:当前研究中对LLMbasedAgent的感知模块探索不够,尤其是在处理代码这类特殊文本输入时,缺乏对树图结构等高级输入模式的研究。角色扮演能力的需求:Agent常常需要在不同任务中扮演多种角色,如代码生成器、测试...
2024-09-24 14:54:39 1340浏览 0点赞 0回复 0收藏
嘿,大家好!这里是一个专注于AI智能体的频道!今天跟大家聊一些关于Agent发展的事情。如果说去年是RAG的元年,大家都在naiveRAG中添加各种技巧,使其变成AdavancedRAG。今年应该就是Agent的元年,年初RAG的迭代变成了AgenticRAG的发展方向,上半年Agent、Agentic、workflow等名词的爆火。当然后来到年终,RAG炒作到了RAG2.0、GraphRAG等上面,最近的RAG炒作变成了MemoryRAG,或者RAG已死等等相关的尽管智能体Agent很热门,但它...
2024-09-13 11:18:54 756浏览 0点赞 0回复 0收藏
获得成就
已积累 7980 人气
获得 1 个点赞
获得 1 次收藏