公众号矩阵

移动端

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

大语言模型论文跟踪

LV.4

跟大家一起读大语言模型论文，欢迎大家推荐论文

帖子 51

声望 581

关注 0

粉丝 1

社区头条作者

私信

关注

主帖 51

回帖

颠覆直觉：Top N 越大，RAG效果可能越差

一、RAG系统的背景与挑战在自然语言处理（NLP）领域，大型语言模型（LLMs）如GPT、BERT等已经展现出了强大的文本生成、问答和摘要能力。然而，这些模型也存在一些显著的局限性。•首先，LLMs的知识是静态的，这意味着它们无法及时更新以反映新信息，导致生成的回答可能过时。•其次，LLMs有时会生成听起来合理但事实上错误的回答，这种现象被称为“幻觉”。•最后，LLMs在涉及高级专业领域的知识时，往往缺乏足够的深度。为了应...

7天前 250浏览 0点赞 0回复 0收藏

Salesforce 新方法让RAG效果飙升

DiversityEnhancesanLLM'sPerformanceinRAGandLongcontextTask大型语言模型（LLMs）的快速发展凸显了上下文窗口限制的挑战，这主要是由于自注意力机制的二次时间复杂度（(O(N^2))，其中(N)表示上下文窗口长度）。这一限制影响了问答（Q&A）中的检索增强生成（RAG）和长上下文摘要等任务。一种常见的方法是选择与查询最相似的内容；然而，这通常会导致冗余，并排除多样化的相关信息。基于最大边缘相关性（MMR）和最远点采样（FPS...

2025-02-17 07:18:09 365浏览 0点赞 0回复 0收藏

WebWalker：通过Multi Agent提升RAG在开放域QA的性能

WebWalker:BenchmarkingLLMsinWebTraversal检索增强生成（RAG）在开放域问答任务中表现出色。然而，传统搜索引擎可能会检索浅层内容，限制了大型语言模型（LLM）处理复杂、多层次信息的能力。为了解决这个问题，我们引入了WebWalkerQA，一个旨在评估LLM执行网页遍历能力的基准。它评估LLM系统性地遍历网站子页面以获取对应信息的能力。同时我们提出了WebWalker，一个通过explorercritic范式模拟人类网页导航的multiagent框架。...

2025-02-06 15:28:32 255浏览 0点赞 0回复 0收藏

OmniThink：如何让 LLM 写出有更有深度的文章

摘要机器写作通常依赖检索增强生成技术，但这些方法受限于模型预定义的范围，难以生成信息丰富的内容。普通检索的信息往往缺乏深度、实用性，且冗余问题严重，导致生成的文章内容浅显、重复且缺乏原创性。为此，我们提出了OmniThink框架，它模拟了人类迭代扩展和反思的认知过程。OmniThink的核心在于模拟学习者逐步深化对主题理解的认知行为。实验表明，OmniThink在不牺牲连贯性和深度的前提下，显著提升了生成文章的知识密度。...

2025-01-22 13:22:59 287浏览 0点赞 0回复 0收藏

MACT：如何用多Agent框架思路实现表格问答

1.表格问答的现状表格问答（TQA，TableQuestionAnswering）是指依据表格形式的数据来回答问题。表格问答任务的任务也越来越复杂，要解决这些复杂任务，就得执行多个推理步骤（多步骤）或者运用不同的推理策略（多类别）。。处理TQA中这些复杂实例的一种常见方法是规划，生成详细的逐步计划并引导推理过程。该方向有两种方法：•针对开源大型语言模型（LLMs）进行微调，但微调需要高质量的数据，通常难以获取•使用闭源的商业LLM...

2025-01-14 12:10:58 367浏览 0点赞 0回复 0收藏

HybGRAG：Hit@1 的平均相对提升率达到 51%的新思路

1.传统RAG存在的问题检索增强生成（RetrievalAugmentedGeneration,RAG）能让大型语言模型（LLMs）从非结构化文档数据库获取信息，使得LLMs就能处理未知事实，并借助额外的文本信息解决开放域问答（OpenDomainQuestionAnswering，ODQA）问题。图检索增强生成（GraphRAG，GRAG）从结构化知识库中检索信息，其中的文档通过关系相互关联。现有的GRAG方法主要集中在两个方向：•从知识图谱（KnowledgeGraphs，KGs）中提取关系信息，...

2025-01-03 13:52:33 513浏览 0点赞 0回复 0收藏

RARE：通过检索增强推理增强打造一个媲美GPT4的RAG系统

精华

1.为什么要提出RARE问答（QA，QuestionAnswering）系统的目的以自然语言提出的问题生成答案，其涵盖的领域和类型极为广泛，从开放领域的QA到更为专业的领域，比如医疗QA。医疗QA要求模型能够掌握复杂的医学知识、解读临床场景，并选出正确且符合上下文的选项。和多数专业领域的QA类似，医疗QA也需要结构化的多步骤推理，从一系列连续的步骤中推理出答案。比如，依据患者信息给出恰当的初始治疗方案，模型首先要识别患者的状况，...

2024-12-25 12:08:55 822浏览 0点赞 0回复 0收藏

一文看懂：四种多Agent范式哪种最好

精华

社区头条

MultiAgentLargeLanguageModelsforConversationalTaskSolving在单个大型语言模型多年来主宰人工智能领域的时代，多智能体系统在对话任务解决中崭露头角。此前的研究虽已展现出其在推理任务和创新尝试方面的潜力，但对于其在对话范式方面的局限以及个体智能体的影响，却缺乏分析。多智能体讨论在不同复杂程度任务中的表现怎样，以及这些对话的结构如何影响进程，都尚不明确。为填补这一空缺，本文对各种讨论范式下的多智能体系统...

2024-12-17 13:03:26 1431浏览 0点赞 0回复 0收藏

MarketSenseAI：GPT4选股，收益率高达72.87%

社区头条

1.LLM与选股资本市场是资本配置的高效渠道，价格发现过程对维持金融系统的健康稳定至关重要。价格发现过程取决于一系列复杂的相互作用因素，包括公司和行业要素、宏观经济数据、动量效应以及政治和地缘政治影响。市场参与者共同参与这一复杂的价格发现机制，以确保金融市场的有效运行。股票选择本质上是一种价格发现机制，市场参与者会关注被视为“定价不当”的股票，从而获得相对于整个市场更具吸引力的回报潜力。这一原则构成...

2024-12-13 10:58:46 1313浏览 0点赞 0回复 0收藏

M3DocRAG：文档问答用哪个多模态大模型效果最好？

1.文档视觉问答现状文档视觉问答（DocVQA）是通过解读文档图像所含信息来回答文本问题的多模态任务。精准高效地回答众多冗长且布局繁杂的文档中的问题，会给金融、医疗保健和法律等诸多领域带来极大益处，在这些领域，文档AI助手能够简化大量文档的日常处理，提升生产力，助力更快、更明智的决策。现有的DocVQA任务，主要有以下两种方案：•1.聚焦于单页文档的视觉问答，如下图。图片•2.从文档中提取文本（比如OCR或PDF文本提...

2024-12-05 11:55:18 1086浏览 0点赞 0回复 0收藏

ChunkRAG：比CRAG提升10个点准确率

1.RAG目前存在的问题RAG系统前前发展取得了一定的成果，但是仍然存在一个问题：在获取文档时会检索到不相关或关联较弱的信息。目前的检索技术，即使是重排序和查询重写，不但不能滤除检索文档中的大量无关信息块，还致使响应生成出现一系列诸如事实不准确、不相关以及幻觉等问题。传统上RAG系统会检索大量整个文档的文本或者其中冗长的部分，认为这些冗长片段可能包含相关信息。然而，这类系统极少单独审视检索到的文档的章节或...

2024-11-27 15:18:54 718浏览 0点赞 0回复 0收藏

4种革新性AI Agent工作流设计模式全解析

AIAgent的四种关键设计模式如下：反思：LLM检查自己的工作，以提出改进方法。使用工具：LLM使用网络搜索、代码执行或任何其他功能来帮助收集信息、采取行动或处理数据。规划：LLM提出并执行一个多步骤计划来实现目标。多智能体协作：多个AI智能体一起工作，分配任务并讨论和辩论想法，提出比单个智能体更好的解决方案。1.反思如图1所示，反思模式允许AIAgent在完成任务后对自身的输出进行再次审视和评估。在这种模式下，AIAge...

2024-11-20 15:13:15 1148浏览 0点赞 0回复 0收藏

斯坦福大学：VideoAgent基于大语言模型的视频QA系统

架构图片上图是VideoAgent的概览图，VideoAgent通过搜索、聚合视频信息来完成长视频QA。整个系统包括一个核心LLM、VLM(视觉大语言模型)和CLIP工具。作者受到人类理解长视频的启发，提出了VideoAgent，通过基于Agent的系统来模拟这一过程的系统。将视频理解过程形式化为一系列状态、动作和观察，其中LLM作为代理控制这个过程。首先，LLM通过浏览从视频中均匀抽样的一组帧来熟悉视频内容的背景。在每次迭代中，LLM评估当前信息（...

2024-11-14 15:17:56 760浏览 0点赞 0回复 0收藏

15种典型RAG框架：卡内基梅隆大学最新RAG综述

精华

1.引言1.1检索增强生成（RAG）概览图片RAG（RetrievalAugmentedGeneration）融合了两大核心组件：（i）检索模块，负责从外部知识库中检索相关文档或信息，利用密集向量表示从大型数据集，如维基百科或私有数据库中识别相关文档。（ii）生成模块，负责处理这些信息，产出类似人类语言的文本，检索到的文档随后被送至生成模块，该模块通常基于transformer架构构建。RAG有助于减少生成内容的“幻觉”现象，确保文本更具事实性和上...

2024-11-07 15:11:42 3410浏览 0点赞 0回复 0收藏

基于LLM的多Agent框架在金融市场数据的应用

架构图片上图展示了本文的整体架构：结合了传统的统计技术和大型语言模型驱动的多智能体系统。首先利用从简单的规则、无监督学习和深度学习技术等现有手段，对金融表格数据中的异常进行识别。异常识别后，将数据传到LLM多智能体系统中。整个系统包括：数据转换Agent、数据专家Agent、报告整合Agent、管理层讨论。其中数据专家Agent包括三个专家：•网络调研专家：这位专家通过网络资源的深入挖掘，如数据发布方的公告、头条新闻...

2024-11-01 15:43:18 1111浏览 0点赞 0回复 0收藏

比GraphRAG还好的LightRAG到底是何方神圣？

1.为什么要提出LightRAG？检索增强生成（RetrievalAugmentedGeneration，RAG）通过整合外部知识源来增强大型语言模型，这种整合使LLM能够生成更准确和与上下文相关的响应，显著提高实际应用中的效用。•通过适应特定领域知识，RAG系统确保所提供的信息不仅相关，而且符合用户的需求。•提供获取最新信息的途径，这种途径在一些快速发展的领域非常重要。•分块在促进检索增强生成过程中起着至关重要的作用。通过将大型外部文本语...

2024-10-30 14:02:36 1004浏览 0点赞 0回复 0收藏

Class-RAG：通过RAG 提高内容审核性能

图片1.ClassRAG推出的背景随着技术的发展，互联网上出现了越来越多的不良内容。过去，使用机器学习的方法来对内容进行情感分类、骚扰识别、仇恨言论检测等。深度学习技术的发展推动了内容审核技术的发展。但是，传统的模型微调方法在完成内容审核任务时，存在很多问题：•首先，内容审核是一项高度主观的任务，意味着标注数据中标注人员之间的一致性较低，可能是由于对政策指南存在不同的解读，尤其是在各种CornerCase上。•其...

2024-10-24 14:30:20 829浏览 0点赞 0回复 0收藏

VisRAG：清华大学&面壁智能提出了一种新的RAG思路，效果提升明显

1.为啥要提出VisRAG？检索增强生成（Retrievalaugmentedgeneration,RAG）已经成为解决LLM幻觉和知识更新的经典方案，典型的RAG流程是基于文本的（以下简称TextRAG），以分割后的文本作为检索单元。但是在真实场景中，知识往往以多模态的形式出现，比如教科书、手册等。这些文档中的文本与图像交织在一起。为了从这类数据源中提取文本，通常需要一个解析阶段，这包括布局识别、光学字符识别（OCR）和文本合并等后处理步骤。虽然...

2024-10-21 12:59:21 1176浏览 0点赞 0回复 0收藏

Adaptive-RAG：性能提升50%以上的高效RAG策略

图片框架自适应RAG通过判断问题的复杂性来自动选择使用哪种RAG策略。作者将问题划分为三类（如上图的C部分）：•开放领域问答：这类任务通常涉及两个模块：一个检索器和一个阅读器。随着具有千亿参数的超强推理能力的LLMs的出现，LLMs和检索器之间的协同作用已经取得了显著进展。然而，尽管在单跳检索增强LLMs方面取得了进展，但某些查询的复杂性需要更复杂的策略。•多跳问答：多跳问答（MultihopQA）是传统开放领域问答（Open...

2024-10-17 16:04:49 992浏览 0点赞 0回复 0收藏

大模型榜单还能信吗？一个假模型就能登顶排行榜

1.缘起目前评测大语言模型主要有两种方法：•通过人类投票来进行评估，比如：ChatbotArena，但是这种往往需要花费较长的时间。•为了降低人类标注的依赖，还有另外一种自动化的LLM基准测试。这种方法成本低、容易扩展。自动化基准测试也成为了众多模型的热门选择，而且测试中的高胜率往往能带来显著的宣传优势。但是，自动化基准测试的胜率可能会受到长度和风格偏见的影响。虽然大多数这种影响是来自训练数据集，但是这也导致存...

2024-10-14 15:07:27 1137浏览 0点赞 0回复 0收藏

获得成就

已积累 1.9w 人气

获得 0 个点赞

获得 0 次收藏