“RAG任何一个环节都可能对最终结果造成重大影响,也就是失之毫厘差之千里”RAG——检索增强生成技术,其技术的核心点在于数据检索;在RAG系统流程中,需要经过文档加载,切片,嵌入,存储和检索等多个步骤。但从实际效果来看,RAG检索还存在很多问题,比如说数据检索不准确,冗余数据多,成本高等多个方面;而怎么优化RAG系统是目前大模型应用领域中一个亟待解决的问题。但具体怎么解决这些问题,就需要从RAG的几个环节入手,...
“向量数据库的检索原理,就是存储不同数据之间的向量关系,在检索时通过向量关系查询相关数据”文本分块也就是chunk技术是大模型领域中非常重要的一项技术,原因就在于大模型众所周知的问题,上下文窗口限制;虽然说现在大模型的窗口经过几次扩容之后已经达到了一个非常可观的长度,但依然还存在很多问题。比如说,长文本导致的模型幻觉问题;中间丢失现象等多种性能问题;而且,在RAG技术中,长文本也是一个亟待解决的问题。...
“语义分析是人工智能实现的基础,而语义分析实现的基础却是向量”说到相似性搜索可能有些人听说过这个词,而有些人可能都没听过这个词;相似性搜索可能很多人都不清楚,但语义搜索应该很多人都听说过;在某种条件下,可以把相似性搜索等价于语义搜索;但相似性搜索又不完全等价于语义搜索。今天,我们就来一起聊一下什么是相似性搜索,这个RAG技术中的大杀器,也是人工智能时代不可或缺的一个技术。相似性搜索在传统的计算机技...
“学习的过程要做到知行合一,还要做到十年如一日”随着大模型技术的发展,AI时代的到来成为不可阻挡的趋势,就像二十年前的互联网一样;而怎么学习大模型就成了很多人的疑问,学习大模型是不是就需要懂技术,懂数学等等。而有些人断断续续的一直在学习大模型,但好像一直在做无用功,没有一点成效;而这些都是什么原因导致的呢?今天我们就从个人的建议来谈谈关于学习大模型技术的方法论,可能并不适用于所有人,或许可能方...
“RAG技术是一项系统化的工程,由多个重要环节组成,而不是单一的技术实体”RAG技术作为目前大模型应用比较火的一个领域,怎么做好一个RAG系统一直是很多人和企业都在思考的一个问题;但RAG并不是一个独立的技术,而是一个技术的集合体,涉及到多个不同的技术;比如说向量数据库,embedding,语义分析,搜索技术等等。而在RAG技术中有一个不被大家所重视的一点就是——分块(chunk);什么是分块?举个例子,西游记作为我国的四大...
“大模型的幻觉是一把双刃剑,并不是非黑即白”大模型技术经过这几年的发展,已经可以算是小有成就;虽然大模型已经开始融入到部分企业应用场景中,但不得不说在应用中大模型还存在很多问题;特别是在一些要求比较严格的应用场景中,甚至都不太敢使用大模型;比如说医疗,自动驾驶等领域。原因就在于大模型的不确定性,毕竟大模型的幻觉问题一直没有被解决;所以这就带来一个问题,大模型能彻底解决幻觉问题吗?也就是说大模...
“RAG和微调即相似,又不完全相同,它们在能力上是互补的。”很多人会奇怪RAG和微调有什么关系,而对RAG和微调了解的人应该都明白为什么会把RAG和微调放在一块讨论。有些人说有了RAG就不需要微调,而另一些人说有了微调就不需要RAG,这到底是怎么回事?RAG和微调之间到底存在什么样的恩恩怨怨?RAG与微调作者在第一次看到RAG和微调的标题时,也是一脸懵逼;RAG和微调有什么关系,它们完全是两种不同的技术,为什么会被放在一...
“面临日益增长的海量数据,怎么高效和准确的检索数据一直是一个值得思考的问题”对大模型应用有所了解的人应该都知道RAG技术——检索增强,本公众号前前后后也写过好几次关于RAG的文章;但在实际的企业应用中,RAG还是面临着各种各样的问题,比如效率问题,准确度问题等等。这些问题虽然在一些应用场景中并没有什么影响,但在某些场景中却是不可接受的;因此就有很多人想方设法的优化RAG技术,比如使用更加高效和准确的检索算...
2024-12-10 15:41:41 292浏览 0点赞 0回复 0收藏
“科学的本质就是怀疑一切”前几天有一个评论问我AIAgent和AgenticAI是否一样,有什么区别;当时看到这个问题就有点蒙,AIAgent我知道,但AgenticAI是什么,这个词还是第一次听说。所以这几天就趁着摸鱼时间看了一下AIAgent和AgenticAI的区别,也在这里简单记录一下,可能理解的并不是很准确,但就当自己的学习记录吧。AIAgent和AgenticAI的区别与联系说实话刚开始看到AgenticAI还是挺蒙的,这玩意和AIAgent是如此的相像,然后...
2024-12-10 10:30:21 295浏览 0点赞 0回复 0收藏
“技术上最容易犯的错就是经验主义,以及拿来主义”最近在对接GPT实现一个功能,具体功能就不说了;主要是这个功能需要流式返回,因此踩了一些坑;所以就在此记录一下。至于什么是流式返回,不清楚的可以自己问度娘。大模型流式返回带来的问题自chatGPT推出以来,其一个字一个字的出现,就像一个打字机;这效果惊艳了很多人,因此在很多场景下很多人都会选择打字机的效果。而打字机效果背后的实现就是流式返回。对技术有过了...
2024-12-09 10:01:08 311浏览 0点赞 0回复 0收藏
“聊天机器人看着是一个很简单的功能,但能把聊天机器人做好却不是一件简单的事”在大模型的众多应用中,聊天机器人可以说是其中比较简单,也是拥有众多应用场景的一个功能;从技术的角度来说,聊天机器人的实现很简单,但其实也很复杂。那到底怎么实现一个聊天机器人呢?聊天机器人的实现对很多学习大模型技术的人来说,可能聊天机器人就是你的第一个实操项目;原因就是其实现起来比较简单,从技术实现来看只需要使用大模型...
2024-12-09 09:54:24 354浏览 0点赞 0回复 0收藏
“大模型上下文窗口的根本问题,是大模型的记忆问题”在上一篇文章中主要介绍了大模型的上下文窗口,以及其与RAG技术的关系与区别;而事实上,大模型上下文窗口面临着更加复杂的问题,因此今天就来详细讨论一下这个问题。大模型长文本大模型(如GPT4、GPT3.5、BERT等)处理长文本时面临一些特殊的挑战和技术细节。对于长文本的处理,常见的问题包括模型的输入长度限制、生成质量控制、计算资源消耗等。以下是一些关于大模型处...
2024-12-05 15:02:35 350浏览 0点赞 0回复 0收藏
“怎么解决大模型的记忆问题,以及保证结果的准确性,目前还是大模型应用中一个亟待解决的问题”看过作者文章的人对RAG技术应该有了初步的了解,但不知道是否了解大模型的窗口大小;即使没有研究过大模型的窗口,但也应该听过每次大模型输入的内容是有限的;而这个有限就是因为大模型窗口的限制。那么,大模型窗口与检索增强的关系是什么样的?怎么解决长对话问题,随着大模型窗口的增加,RAG会死吗?大模型窗口与RAGRAG——检...
2024-12-04 13:36:39 397浏览 0点赞 0回复 0收藏
“AIAgent的核心是推理规划能力,其次才是函数调用和记忆能力;但三者又缺一不可。”最近发现有些人还不了解什么是AIAgent,或者是看了Agent的概念,但还是不知道什么是AIAgent,今天我们就来详细介绍一下什么是AIAgent。什么是AIAgent?这篇关于Agent的文章,即是对AIAgent的介绍,也是为了记录自己对AIAgent的理解。网上的介绍说,AIAgent中文翻译叫智能体,是一种能够感知环境,进行决策和执行动作的智能实体。看了以上的定...
2024-12-03 13:13:53 575浏览 0点赞 0回复 0收藏
大模型(LargeModel,如GPT、PaLM、LLaMA等)的重点与难点在于它们的构建、训练、应用以及部署过程中涉及到的多方面挑战。以下从技术、资源、应用等角度详细说明其重点与难点。1.大模型的重点(1)规模与性能参数规模:大模型的核心是参数量通常达到数十亿甚至万亿级别,参数的规模直接影响模型的表达能力和推理能力。多模态扩展:部分大模型支持跨模态输入(如文本、图像、音频等),需要对不同模态的数据进行融合建模。通用性...
2024-12-02 15:28:38 1026浏览 0点赞 0回复 0收藏
“技术的发展是一个循序渐进的过程,而我们要做参与者,而不是旁观者”最近一段时间做了一次小实验,那就是用大模型写公众号,在一字不改的情况下直接发布,会是什么效果。两次测试,第一次使用的是字节的豆包,第二次使用的是chatGPT;而且第二次内容的阅读量直接破千。不知道大家有没有看出来哪两个是大模型写的文章;一个是豆包写的——《人工智能:开启未来新纪元》和GPT写的——大模型技术全面解析,从大模型的概念,...
2024-12-02 15:24:50 265浏览 0点赞 0回复 0收藏
“RAG的本质是高效检索,而知识库,向量数据库和知识图谱只是组织数据的一种形式”这两天在之前的一篇关于RAG检索增强的文章中有一个评论,问RAG和知识图谱的区别;这时才发现,原来很多人对RAG技术还没有一个本质的认识,以及与其相关的本地知识库,向量数据库等。所以,今天就来介绍一下上面的这些概念,以及其联系与区别。RAG——检索增强生成前面写过好几篇关于RAG的文章,但可能到现在很多人还不明白什么是RAG——检索增...
2024-11-29 20:54:45 698浏览 0点赞 0回复 0收藏
“老话说温故而知新,在大模型不断的使用过程中,慢慢会发现一些自己之前没有注意过的东西”今天我们来认识几个名词,当然这些名词也已经不是新名词了,但之前对它们的理解只停留在表面,而今天要来加深一些理解。提示词和补全以及元学习理论上来说提示词是与大模型打交道的基础,人类要想和大模型进行交互就必须通过提示词来实现。而从表面上来看,任何文本都可以作为提示词,但如何编写一个有效的提示词,才能让大模型更好地...
2024-11-28 15:48:13 327浏览 0点赞 0回复 0收藏
“文本生成是生成新的内容,而聊天补全是对上下文的理解能力”这两天在对接微软的openAI模型时,看到了一个名词叫聊天补全;刚开始还不知道聊天补全是什么意思,以为是类似于输入法的联想功能;但看了文档才发现,原来聊天补全就是大模型的对话功能。这时突然想到一个问题,聊天补全是大模型的对话,那之前一直说的文本生成是什么?聊天补全与文本生成的区别在今天之前,个人一直认为大模型对话就是文本生成,文本生成就是与...
2024-11-27 11:31:45 379浏览 0点赞 0回复 0收藏
引言大模型(LargeModels)是人工智能发展的里程碑,特别是基于深度学习的预训练模型(如GPT、BERT)。随着模型参数规模的指数级增长,大模型在自然语言处理(NLP)、计算机视觉(CV)等领域取得了突破性成果。本文将深入解析大模型的核心技术、应用场景、优化策略及未来挑战。大模型的背景与定义1.1什么是大模型大模型指的是参数规模超过亿级甚至千亿级的深度学习模型。特点:高容量:能够捕捉复杂模式和分布。通用性:支持多...
2024-11-27 11:25:22 3110浏览 0点赞 0回复 0收藏