公众号矩阵

移动端

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

PaperAgent

LV.5

日更，解读AI前沿技术热点Paper

帖子 63

声望 719

关注 0

粉丝 1

社区头条作者热门内容榜上榜作者

私信

关注

主帖 63

回帖

DeepSeek全新注意力机制NSA发布，超快速长文训练与推理

精华

社区头条

DeepSeek官推发布了最新技术成果NSA：一种面向硬件且支持原生训练的稀疏注意力机制，专为超快长上下文训练与推理设计。NSA的核心组成：动态分层稀疏策略粗粒度的token压缩细粒度的token选择💡NSA针对现代硬件进行了优化设计，显著提升了推理速度，并有效降低了预训练成本——同时不损失性能。在通用基准测试、长文本任务和基于指令的推理任务中，NSA的表现均能达到甚至超越传统全注意力模型的水平。1.动态分层稀疏策略NSA的核心...

2025-02-21 12:18:57 472浏览 0点赞 0回复 0收藏

比GraphRAG更懂“思考”，微软又开源PIKE-RAG：主打复杂私域知识理解和推理

继GraphRAG之后，微软又发布PIKERAG，主打在复杂企业场景中私域知识提取、推理和应用能力，PIKERAG已在工业制造、采矿、制药等领域进行了测试，显著提升了问答准确率。demo示例：多层次异构的知识库构建与检索+自我进化的领域知识学习RAG系统在满足现实世界应用的复杂和多样化需求方面仍然面临挑战。仅依靠直接检索不足以从专业语料库中提取深度领域特定知识并进行逻辑推理。企业场景复杂多样的Query基于此，微软亚洲研究院提出...

2025-02-14 13:06:05 2352浏览 0点赞 0回复 0收藏

RAG圈的DeepSeek，中科院DeepRAG让大模型带着“思考”检索，性能提升21.99%

社区头条

将推理与RAG相结合仍面临挑战，例如复杂查询需要多步分解，且LLMs难以生成精确的子查询，导致检索效率低下。人类思维过程与DeepRAG的对应关系。具体来说，检索叙事确保了结构化和自适应的检索流程，根据之前检索到的信息生成子查询，并且原子决策动态地决定是否检索外部知识，或者仅依赖于每个子查询的参数知识。中科院&中科大&腾讯微信AI部联合推出最新（2025.02）DeepRAG，让大型语言模型逐步推理检索：DeepRAG框架将检索增强...

2025-02-05 18:09:35 1216浏览 0点赞 0回复 0收藏

Kimi思考模型k1.5是怎么练成的？细节曝光

社区头条

Kimi发布新一代多模态思考模型k1.5，在竞赛数学、代码能力及视觉思考等测试中，k1.5模型性能已达到全球领先模型OpenAIo1正式版水平，月之暗面也成为OpenAI之外，全球第二家到达该水平的人工智能企业。Kimi1.5longCoT评测结果longtoshort，用长链式思考技术改进短链式思考模型，在短链式推理性能测试中，k1.5模型在数学、代码、视觉多模态和通用能力等方面到达或超越GPT4o、ClaudeSonnet3.5等全球领先模型。Kimi1.5shortCoT评测...

2025-01-22 11:58:39 1176浏览 0点赞 0回复 0收藏

AMD发布科研Agent，论文自动化评分趋近顶会NeurIPS水平！

科学发现漫长且成本高昂，为了加速科学发现，降低研究成本，并提高研究质量，芯片厂商AMD推出了AgentLaboratory，这是一个基于自主大型语言模型（LLM）的框架，能够完成整个研究流程。AgentLaboratory接受人类研究想法和一组笔记作为输入，将其提供给一系列由LLM驱动的专门Agent组成的流程线，并产生研究报告和代码仓库。AgentLaboratory接受人类提供的研究想法，并通过三个阶段——文献综述、实验和报告撰写——来产生全面的研...

2025-01-13 10:20:34 521浏览 0点赞 0回复 0收藏

微软：GPT-4o-mini只有8B，o1-mini仅100B

关于主流闭源LLM的参数规模一直讨论不断，在2024年最后2天来自微软的一篇关于检测和纠正临床笔记中医疗错误的测试基准MEDEC的研究一不小心直接漏了它们的参数规模：o1preview,GPT4，GPT4o和Claude3.5Sonnet。Claude3.5Sonnet（20241022），175BChatGPT，175BGPT4，约1.76TGPT4o，200BGPT4omini（gpt4o20240513）只有8B最新的o1mini（o1mini20240912）仅100Bo1preview（o1preview20240912）300B实验部分也是将大模型参数规模分为...

2025-01-02 13:47:36 550浏览 0点赞 0回复 0收藏

微软开源PromptWizard，摔碎了提示工程师的饭碗

社区头条

PromptWizard(PW)旨在自动化和简化提示优化。它将LLM的迭代反馈与高效的探索和改进技术相结合，在几分钟内创建高效的prompts。PW的核心是其自我进化和自适应机制，LLM会同时迭代生成、评论和改进提示和示例。此过程通过反馈和综合确保持续改进，实现针对特定任务的整体优化。PromptWizard经过45多项任务的严格评估，涵盖了一般挑战和特定领域挑战。与最先进的技术（包括Instinct、InstructZero、APE、PromptBreeder、EvoPrompt...

2024-12-24 14:05:02 862浏览 0点赞 0回复 0收藏

被OpenAI带火的强化微调RFT技术解析

社区头条

OpenAI年终大戏第二场推出了强化微调RFT(ReinforcementFineTuning)，它可以让你用几十到几千个的训练数据，为特定的复杂任务构建专家模型，加强了模型如何处理类似问题的推理，微调后的o1mini得分提高80%，反超o1正式版！强化微调技术的一种实现方式：首先通过监督式微调（SupervisedFineTuning）对模型进行预热，然后利用在线强化学习，特别是PPO算法，进一步微调模型。这种方法能够自动采样多种推理路径，并从真实答案中自然...

2024-12-12 11:02:29 964浏览 0点赞 0回复 0收藏

Auto-RAG开源，复杂多跳问题就这么解决了！

社区头条

AutoRAG是一个以LLM强大的决策能力为核心的自主迭代检索模型，通过多轮对话的方式建立LLM与检索者之间的交互模型，通过迭代推理确定何时检索信息、检索什么内容，在获得足够的外部知识后停止迭代，并将答案提供给用户。一个具体的例子展示了AutoRAG如何处理复杂的多跳问题。AutoRAG进行迭代推理，策略性地规划检索，提取相关知识，精确识别信息需求，并为下一次检索细化查询，最终收敛到最终答案。在这个例子中，AutoRAG在与...

2024-12-04 12:17:20 1162浏览 0点赞 0回复 0收藏

o1的风又吹到多模态，直接吹翻了GPT-4o-mini

开源LLaVAo1：一个设计用于进行自主多阶段推理的新型VLM。与思维链提示不同，LLaVAo1独立地参与到总结、视觉解释、逻辑推理和结论生成的顺序阶段。LLaVAo1超过了一些更大甚至是闭源模型的性能，例如Gemini1.5pro、GPT4omini和Llama3.290BVisionInstruct。基础模型与LLaVAo1的比较。基础模型Llama3.211BVisionInstruct在推理过程中有明显的缺陷，整个推理过程中出现了几个错误。相比之下，LLaVAo1首先概述问题，从图像中解释相关...

2024-11-19 14:49:54 744浏览 0点赞 0回复 0收藏

一个轻量级RAG文本切块项目Chonkie

Chonkie：实用的RAG分块库，轻量级、速度快，可随时对文本进行分块。图片支持的方法Chonkie提供了多个分块器，可高效地为RAG应用程序拆分文本。以下是可用分块器的简要概述：TokenChunker：将文本分割成固定大小的标记块。WordChunker：根据单词将文本分成块。SentenceChunker：根据句子将文本分成块。SemanticChunker：根据语义相似性将文本分成块。SDPMChunker：使用语义双重合并方法分割文本。基准(VSLangChainLlamaIndex)尺...

2024-11-13 15:17:24 1022浏览 0点赞 0回复 0收藏

o1蒙特卡洛树的风又吹到了Agentic工作流！

AFlow是一个用于自动生成和优化Agentic工作流的框架。它使用蒙特卡洛树搜索（MonteCarlotreesearch）在代码表示的工作流空间中查找有效的工作流，用机器工作取代手动开发。在各种任务上都显示出超越手工工作流的潜力，由MetaGPT开源。AFLOW（以黄色突出显示）在所有六个基准测试中始终优于所有自动化工作流优化和手动设计的方法（IO、CoT、CoTSC、MedPrompt、MultiPersona、SelfRefine、ADAS）AFLOW在GSM8K上的树状迭代过程：...

2024-11-06 14:43:57 1162浏览 0点赞 0回复 0收藏

放弃折腾，AutoRAG一键锁定最佳RAG技术栈！

AutoRAG：RAGAutoML工具可自动为你的数据找到最佳RAGPipeline。市面上有许多RAGPipeline和模块，但不知道哪种Pipeline最适合“你自己的数据”和“你自己的用例”。制作和评估所有RAG模块非常耗时且难以完成。AutoRAG支持一种简单的方法来评估许多RAG模块组合。可以使用自己的评估数据自动评估各种RAG模块，并找到最适合自己用例的RAGPipeline。AutoRAG支持的RAG技术栈支持16种解析模块、10种切块模块解析模块：PDFMiner，PDFPlu...

2024-10-31 14:51:44 1135浏览 0点赞 0回复 0收藏

KAG开源了，知识增强掀翻RAG，性能翻倍

KAG（KnowledgeAugmentedGeneration）框架早在9月份就已经发布，近期终于开源了，它的核心在于提出了：一种LLM友好的知识表示方法知识图谱与原始文本块之间的相互索引逻辑形式引导的混合推理引擎以及基于语义推理的知识对齐归功于在构建更有效的索引、知识对齐和混合解决库方面的创新，KAG框架在多跳问答任务中相比于现有的RAG方法有显著的性能提升，2wiki、MuSiQue数据集上的EM指标直接翻倍。此外，KAG框架在蚂蚁集团的电子政...

2024-10-28 15:36:32 2934浏览 0点赞 0回复 0收藏

超级Agent：像人一样操控电脑！

Anthropic深夜发布重大更新：升级版Claude3.5Sonnet、新型号Claude3.5Haiku以及超级Agent：computeruse。新的ComputerUse可能是迄今为止最先进的AIAgent之一，它可以像人类一样使用计算机——查看屏幕、移动光标、点击和输入文本。Claude3.5Sonnet：强悍编程能力编程能力显著提升，SWEbench测试从33.4%提升到49.0%,超过所有公开模型)，工具使用能力增强，价格和速度维持不变https:www.swebench.com超级Agent：computeru...

2024-10-23 12:46:07 951浏览 0点赞 0回复 0收藏

o1快慢思考的风又吹到了Agent！

智能体（Agent）通过自然对话与用户互动有两个任务：交谈和规划推理。对话回应必须基于所有可用信息，行动必须有助于实现目标。与用户交谈和进行多步推理和规划之间的二分法，类似卡尼曼引入的人类快速思考和慢速思考系统。为此，GoogleDeepMind提出了一个名为TalkerReasoner的双系统架构，以模拟人类的两种思考系统。TalkerReasoner的双系统架构，用于构建能够通过自然对话与用户互动的智能代理。这种架构受到人类“快速思考”...

2024-10-18 15:28:05 1367浏览 0点赞 0回复 0收藏

忘记Tool检索，拥抱全新Agent ToolGen！

传统大模型工具调用的方法依赖于将工具描述作为上下文输入，这受到上下文长度的限制，并需要单独的、通常效率低下的检索机制。之前基于检索的方法与ToolGen之间的比较。以前的方法使用检索器根据相似性匹配检索相关工具，这些工具进一步被放入提示中供LLMs选择。ToolGen可以通过直接生成工具标记来检索工具。ToolGen也可以在不依赖任何外部检索器的情况下完成任务。为此，微软等提出ToolGen，这是一种将工具知识直接整合到LLM参...

2024-10-16 16:33:14 1178浏览 0点赞 0回复 0收藏

o1推理扩展的风吹到了RAG，性能飙升58.9%！

以往的研究主要集中在通过增加检索文档的数量或长度来扩展检索增强生成（RAG）中检索到的知识。然而，仅增加知识量而不提供进一步的指导存在一定的局限性。为此，GoogleDeepMind研究了RAG在推理计算扩展（InferenceScaling）情况下的性能，特别是当上下文很长时。通过应用最优配置，在长上下文LLMs上扩展推理计算可以实现高达58.9%的性能提升。用于RAG的推理扩展策略为了衡量推理计算，定义了有效上下文长度，即在LLM生成最终答...

2024-10-10 15:28:08 1149浏览 0点赞 0回复 0收藏

一种将RAG、KG、VS、TF结合增强领域LLM性能的框架

SMARTSLIC框架：旨在将RAG结合向量存储（VectorStores）、知识图谱（KnowledgeGraphs）和张量分解（TensorFactorization）来增强特定领域的大型语言模型（LLMs）的性能。SMARTSLIC系统框架SMARTSLIC框架的关键组成部分和操作流程：包括构建特定领域的数据集、知识图谱本体论、向量存储以及检索增强生成（RAG）过程：A.特定领域的数据集：项目从由主题专家（SMEs）选定的核心文档开始，这些文档代表了想要构建数据集的特定领域。...

2024-10-08 14:59:36 1408浏览 0点赞 0回复 0收藏

一种支持4种多模态RAG技术的引擎：VARAG

VARAG（视觉增强检索和生成）：是一种视觉优先的RAG引擎，强调基于视觉的检索技术。它通过视觉语言模型集成视觉和文本数据，增强了传统的检索增强生成(RAG)系统。🚀支持的检索技术VARAG支持多种检索技术，针对不同用例进行了优化，包括文本、图像和多模式文档检索。以下是支持的主要技术：简单RAG（带OCR）简单RAG（检索增强生成）是一种高效而直接的方法，用于从文档中提取文本并将其输入到检索管道中。VARAG通过Docling整合...

2024-09-29 16:33:46 1691浏览 0点赞 0回复 0收藏

获得成就

已积累 2.6w 人气

获得 0 个点赞

获得 1 次收藏