公众号矩阵

移动端

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

NLP前沿1

LV.2

一手ai news分享 & 热点paper解读

帖子 23

声望 187

关注 0

粉丝 0

社区头条作者

私信

关注

主帖 23

回帖

DeepSeek开源周，第三弹， DeepGEMM来袭！

今天开源了deepseekv3中提到的的FP8GEMM内核。300行代码的暴力cuda美学，看不太懂，但是每天都可以打个酱油支持普通的矩阵乘法以及MixofExperts分组矩阵乘法。使用CUDA编写，安装时无需编译，所有内核在运行时通过轻量级的即时编译（JIT）模块动态编译。DeepGEMM设计，避免了对CUTLASS和CuTe的过度依赖，采用了更简洁的设计，核心代码只有大约300行。整个库就是非常“轻量化”，但同时性能又很强大，甚至超过了专家调优的库。在...

5天前 328浏览 0点赞 0回复 0收藏

这个开源项目厉害了：一键部署DeepSeek R1！

最近在折腾DeepSeekR1的私有部署，发现不少开发者都遇到了类似的困扰。明明按照文档一步步来，却总是会碰到这样那样的问题分片下载老是断，模型合并偶尔出错，环境配置更是让人头大。要是再遇到多机分布式、高并发或者国产芯片这些场景，那就更不好处理了。正好最近看到一个挺有意思的开源项目GPUStack(https:github.comgpustackgpustack)。它用Apache协议开源，主要就是为了解决DeepSeekR1这类大模型的部署问题。试用下来体验...

2025-02-18 11:50:42 862浏览 0点赞 0回复 0收藏

只需50美元！最简单的推理扩展方案，效果媲美o1！

这个工作目标是，找到一种简单的方法，可以实现testtimescalling。关键点有2个，构建高质量的监督数据1k，用于监督微调；一个BudgetForcing的方法，用于限定模型的推理过程。经过这么一折腾，模型的性能随着推理token数量变长而编号。如何构建高质量的1k数据初始收集：从16个不同的来源收集了59,029个问题，包括NuminaMATH、AIME、OlympicArena、OmniMath、AGIEval等。最终筛选：通过质量、难度和多样性三个标准，从59K个问题中...

2025-02-07 14:07:32 294浏览 0点赞 0回复 0收藏

RAG升级二维战士！通义实验室放大招

📜摘要检索增强生成（RAG）在开放域问答任务中表现出色。然而，传统搜索引擎可能会检索浅层内容，限制了大型语言模型（LLM）处理复杂、多层次信息的能力。为了解决这个问题，我们引入了WebWalkerQA，一个旨在评估LLM执行网页遍历能力的基准。它评估LLM系统性地遍历网站子页面以获取对应信息的能力。同时我们提出了WebWalker，一个通过explorercritic范式模拟人类网页导航的multiagent框架。广泛的实验结果表明，WebWalkerQA具有...

2025-01-23 10:07:24 324浏览 0点赞 0回复 0收藏

CAG来了，RAG慌了？

CAG：CacheAugmentedGeneration缓存增强生成。不要做RAG了：当缓存增强生成对于知识任务就足够时检索增强生成（RAG）作为一种通过整合外部知识源来增强语言模型的有效方法，已经得到了广泛应用。然而，RAG引入了检索延迟、文档选择潜在错误和系统复杂性增加等挑战。随着具有显著扩展上下文窗口的大型语言模型（LLMs）的出现，本文提出了一种替代范式，即缓存增强生成（CAG），它绕过了实时检索。我们的方法涉及预先加载所有相关...

2025-01-14 13:14:55 379浏览 0点赞 0回复 0收藏

langchain送来新年礼物，开源canvas来了

langchain也送来新年礼物了，对标openaicanvas的项目开源。OpenCanvas不是又一个AI聊天机器人。它是一个开源的Web应用，可以让你与AI助手协同工作，以更高效、更智能的方式创作文档和代码。它汲取了OpenAI“Canvas”的灵感，但又有所创新，为你带来更强大的功能和更灵活的体验。试用地址：https:opencanvas.langchain.comOpenCanvas的独特之处：完全开源，自由掌控：所有代码都是开源的，并采用MIT许可。你可以自由地使用、修改...

2025-01-06 11:32:52 366浏览 0点赞 0回复 0收藏

太空中的RAG：宇航员如何在火星上生存下去，而无法使用谷歌？

宇航员如何在火星上生存而无需谷歌搜索？太空、火星、外星人、太空任务……自从人类首次见证尼尔·阿姆斯特朗登上月球以来，所有关于太空探索的话题以及太空的隐藏秘密一直让我们着迷。随着技术的进步，我们的目光投向了火星殖民和深空探索。尽管太空探索的美丽吸引了无数电影的关注，但它也带来了许多挑战，其中一个关键挑战是：在不依赖地球互联网基础设施的情况下获取实时、可操作的信息。显然，宇航员在太空中无法使用谷歌...

2024-12-26 13:37:04 456浏览 0点赞 0回复 0收藏

Anthropic最新研究，Claude学会“演戏”了！

社区头条

Anthropic刚刚发布了一篇疯狂的新论文。ALIGNMENTFAKINGINLARGELANGUAGEMODELS。人工智能模型会“伪装对齐”——在训练期间假装遵守训练规则，但在部署后会恢复其原始行为！研究表明，Claude3Opus在训练中有策略地遵守有害请求，以保持其无害行为。也就是说，模型并非简单地随机或无意识地做出反应，而是经过了类似人类的思考过程，并且其思考的目标是维持它原本“无害”的行为模式。举个例子，模型可能会这样“思考”：“我现...

2024-12-26 13:32:00 617浏览 0点赞 0回复 0收藏

Tokenizer不存在了？Meta开源BLT算法！

分词化tokenize化，是模型理解自然语言的最小单元。但是一些问题，如多语言、错别字、计算开销等问题，基于Byte的分词更为流行。Meta的这个工作开源ByteLatentTransformer（BLT）的方法。BLT的核心思想：直接处理原始字节：与传统的基于词元的模型不同，BLT直接使用构成文本的最小数字单位字节进行处理。这从根本上消除了对分词的需求，避免了分词可能带来的误差和局限性。动态patching：这是BLT的关键创新。它根据文本的复杂度...

2024-12-18 10:52:44 735浏览 0点赞 0回复 0收藏

OpenAI VS Deepmind：年度最大AI对决！

OpenAI和Deepmind在pk了？红方：openai从明天开始“OpenAI的12天”，每天都会有直播活动，展示新产品和演示。目前社区猜测可能发布的产品，如O1full、Sora视频模型和GPT4.5。openai挖走了deepmind的3名高级工程师，他们在视觉方面的研究，目前落后于最近的SOTA视觉方法，像ViT、SigLIP、PaliGemma这些开源模型，开始抢人大战。蓝方：deepmindGenCast天气模型代码和模型开源，GoogleDeepMind在《自然》杂志上发布了一个AI天气预...

2024-12-06 07:37:00 709浏览 0点赞 0回复 0收藏

微软LazyGraphRAG来了，700倍成本压缩！

社区头条

微软最新又改版了一波GraphRAG，这波把知识图谱丢了，只剩下无向图了。带来的优势是：LazyGraphRAG数据索引成本与向量RAG相同，且为全图RAG成本的0.1%。对于与向量RAG相当的查询成本，LazyGraphRAG在局部查询中优于所有竞争方法，包括LongRAG和GraphRAGDRIFT搜索以及GraphRAG局部搜索。相同的LazyGraphRAG配置在全局查询方面也显示出与GraphRAG全局搜索相当的答案质量，但查询成本降低了700多倍。对于GraphRAG全局搜索的4%查询...

2024-11-28 15:56:20 718浏览 0点赞 0回复 0收藏

测试时训练(TTT)太强了！

论文笔记分享，标题：TheSurprisingEffectivenessofTestTimeTrainingforAbstractReasoning测试时训练（TTT）是个新概念：在推理过程中使用从输入数据派生的损失暂时更新模型参数文章的结论：TTT显著提高了ARC任务上的性能，与基线微调模型相比，准确率提高了高达6倍；将TTT应用于一个8B参数的语言模型，在ARC的公共验证集上达到了53%的准确率，将公共和纯神经网络方法的最新水平提高了近25%。通过将我们的方法与最近的程序生成...

2024-11-21 14:15:17 902浏览 0点赞 0回复 0收藏

GraphRAG进化，效率翻倍！

circlemindai组织开发了一个名为fastgraphrag的开源项目。这个项目的目标是提供一个高效、可解释且精度高的快速图检索增强生成（FastGraphRAG）框架。该框架专门为Agent驱动的检索工作流程设计，能够轻松融入检索管道中，提供先进的RAG功能，同时避免了构建和设计Agent工作流程的繁琐复杂性。项目的宗旨是增加全球成功的通用人工智能（GenAI）应用数量。为实现这一目标，他们开发了记忆和数据工具，使LLM应用能够利用高度专业...

2024-11-15 12:46:57 960浏览 0点赞 0回复 0收藏

一篇大模型RAG最新综述

好久没分享过综述了，今天分享一个最新的RAG综述，来自卡内基梅隆大学。标题：AComprehensiveSurveyofRetrievalAugmentedGeneration(RAG):Evolution,CurrentLandscapeandFutureDirections1.引言1.1RAG技术概述检索增强生成技术（RAG）主要由两个关键部分构成：其一是检索组件，主要职责是从外部数据库（如维基百科或私有库）中提取相关信息，通过密集向量表征进行文档识别；其二是生成组件，基于transformer结构，对获取的信息...

2024-11-08 15:48:08 1332浏览 0点赞 0回复 0收藏

向o1看齐，Google开源RAG推理扩展，提升近60%

论文笔记分享，标题InferenceScalingforLongContextRetrievalAugmentedGeneration，来自googledeepmindopenaio1通过让扩展推理，让模型在推理方面达到非常优异的性能。google这篇内容，核心想验证2个点RAG系统的性能，如何从推理计算扩展中受益通过建立RAG性能和推理参数之间的关系模型来预测给定预算下的最佳测试时计算分配文中应用了2种扩展方式，DRAG，IterRAG均有效的提高了RAG系统的性能。并且，当最优分配时，增加推理计...

2024-11-05 14:39:40 730浏览 0点赞 0回复 0收藏

传统RAG凉凉？多模态RAG带来工业级革命

论文笔记分享，标题BeyondText:OptimizingRAGwithMultimodalInputsforIndustrialApplications多模态VL模型很早的就进入了这个圈子，早的有LLava，近一点的gpt4o。这个内容的主要想论证一个事情，在工业界，同时包含文本和图像的RAG系统，相比于单文本的RAG系统会提高整体性能？当然这个问题的结论是，会提高，所以还额外做了一些，优化多模态流程探索的工作。首先，多模态的结合，2种模式，一种是图片保持不变，建立起图片向量...

2024-10-30 15:23:54 825浏览 0点赞 0回复 0收藏

从传统 RAG 到图 RAG，赋予大型语言模型更强大的知识力量

大型语言模型(LLMs)在固定数据集上进行训练，其知识在最后一次训练更新时就已固定。ChatGPT的常规用户可能已经注意到其众所周知的局限性：“训练数据截止到2021年9月”。这种局限性会导致模型产生不准确或过时的响应，因为它们会“幻觉”信息。在不重新训练或微调的情况下，用新信息更新模型或增强其上下文理解能力，在资源和人力方面都极具挑战。检索增强生成(RAG)检索增强生成(简称RAG)是一种通过整合来自外部可靠知识库的信...

2024-10-25 14:09:52 942浏览 0点赞 0回复 0收藏

大模型数学能力翻车实锤！Apple新研究暴露真相!

这篇文章的结论是：LLM无法进行真正的推理。并做出了一系列的实验论证，大模型仅仅是记住了目标序列。10月份有很多文章在论证这个事情。比如之前写过一篇推文介绍大模型在规划的能力上表现仍然非常糟糕（现实再次给大模型带来沉重打击）。后来在《PROCBENCH:BENCHMARKFORMULTISTEPREASONINGANDFOLLOWINGPROCEDURE》中验证了一个结论：在没有相关领域经验或知识的情况下，LLMLRM似乎无法遵循基本指令，尤其是在指令长度增加时。...

2024-10-25 14:01:55 714浏览 0点赞 0回复 0收藏

RAG遇上知识冲突，Google祭出终极大招！

论文笔记分享，标题：AstuteRAG:OvercomingImperfectRetrievalAugmentationandKnowledgeConflictsforLargeLanguageModels，来自googlecloud在RAG的时候，再好的recall+rerank+筛选策略，都会出现知识冲突，或query无关的候选知识的情况。文中称这种现象为“不完美检索”。通常，当检索精度不低于20%时，RAG是有帮助的。当检索精度接近0时，带有RAG的模型的表现要比没有RAG的模型差。添加更多的检索段落并不一定导致更好的性能，...

2024-10-22 13:03:33 824浏览 0点赞 0回复 0收藏

Entropix，终于找到了真正解决幻觉的方法了

最近，神秘大佬开源一个框架entropix,2周不到收获2.4kstar。Entropix的核心思想是通过量化模型的不确定性，来做出更多的“思考”，从而获得更好的效果。当大模型在预测下一个词时，模型会为每个词分配一个可能的概率。如果模型特别笃定的那个token的概率都很低，也就是不确定性很高的时候，熵越高。很多时候，想减少模型的幻觉时，可能会将模型的采样超参数如temperature设为0。但是这样做并不一定能提高模型不产生幻觉输出的概...

2024-10-15 15:06:43 1057浏览 0点赞 0回复 0收藏

获得成就

已积累 3799 人气

获得 0 个点赞

获得 0 次收藏