自从2022年12月ChatGPT横空面世以来,AI领域获得了十足的关注和资本,其实AI的概念在早些年也火过一波,本轮AI热潮相比于之前的AI,最大的区别在于:生成式。通过海量文本训练的、能识别人类语言、执行语言类任务、拥有大量参数的模型,称之为大语言模型。GPT、LLaMA、Mistral、BERT等都是LLM,LLM是对训练文本信息的压缩,同时拥有了泛化能力,不同于数据库和搜索引擎,LLM能创造性地生成历史上没有出现过的文本内容。虽然LLM...
我阅读了一篇有关"AdvancedRAG"的论文,在阅读这篇论文后,我发现其中的一些概念和技术具有很高的实用价值。接下来,我将结合我在公司的实践经验,分享以下RAG系统的三个阶段的优化:预检索和数据索引技术检索技术检索后处理预检索和数据索引技术使用LLM增加信息密度如果来⾃异构数据源(例如PDF、抓取的⽹络数据、⾳频记录)的⾮结构化数据没有经过特定处理,信息密度比较低下,包含不相关的信息和或噪⾳,或者有很多信息重复...
最近工作比较忙,一直在重构公司现有的RAG推荐系统。在给GraphRAG提交了几个PR并成功合并后,暂时没有继续对GraphRAG做出更多贡献。然而,最近同事和粉丝纷纷私信我,他们最常问的问题有:"什么时候应该使用GraphRAG?","在哪些场景下应该使用传统的RAG"以及"我们目前在公司使用的是传统RAG,那要如何与GraphRAG相结合呢?"。为了系统地解答这些问题,我决定写一篇文章,对这些问题进行详细的探讨。我将先从多个方面解释Grap...
在使用LLM应用时,我们经常会遇到需要向知识库中添加新文件的需求。传统的RAG通过对chunk进行embedding来处理这种情况,并且新文件的加入不会影响之前生成的chunkembedding。但是,GraphRAG的处理方式有所不同。由于其索引过程涉及多个pipeline阶段,因此可能会产生一些问题:当新文件加入时,是否需要对已有的文件重新进行索引?缓存在这个过程中起到了什么作用?哪些workflow需要重做?带着这些问题,我们来一探究竟。GraphRA...
检索增强型生成(RAG)技术已被证明在整合最新信息、减少错误想象以及提升回应质量方面非常有效,特别是在特定领域中。虽然已经提出了许多旨在通过查询依赖的检索来增强大型语言模型的RAG方法,但这些方法仍然受到其复杂实现和延长响应时间的影响。通常,一个RAG工作流涉及多个处理步骤,每个步骤都可以以不同的方式执行。那么哪些处理步骤的组合能起到好的效果呢?今天给大家分享一篇相关的论文:RAG领域的最佳实践[1]。1.介...
在互联网时代,数据爆发式增长,如果高效的分析数据成为一个亟待解决的问题。SQL是数据分析师的常用工具,编写高效的SQL需要用户具备一定的IT基础,对于普通人员来说存在一定门槛。TexttoSQL技术可以实现自然语言转换成SQL,用户只需要用自然语言描述自己的目标,TexttoSQL工具就可以自动生成对应的SQL,大大降低SQL编写的门槛和效率。为了提高TexttoSQL的效果,北航提出了一个基于LLM和智能体的TexttoSQL框架。实验表明,新...
在当前的知识检索领域,RAG技术正引领着最新潮流,它的目标是为大型语言模型(LLM)提供丰富而精确的上下文信息。然而,传统RAG方法在处理信息时经常会忽略上下文细节,这限制了其从知识库中提取相关信息的能力。解决如何有效保存上下文信息的问题,已成为该领域的重点。针对这一挑战,Anthropic的研究团队提出了一种名为“上下文检索”的创新技术,使得在这一领域取得了重大突破。他们最近发表的研究详细介绍了这一技术,展...
在这个信息爆炸的时代,我们每天都被大量的数据和信息所包围。对于企业和研究人员来说,如何从这海量的信息中迅速地找到自己需要的针对性数据,已经成为了一个亟待解决的问题。幸运的是,香港大学的研究团队最近推出的LightRAG系统,为我们提供了一个新的解决方案。LightRAG系统是基于RAG(RetrievalAugmentedGeneration)的开源技术,它通过引入先进的双层检索范式和基于图的数据结构,大大提升了信息检索的全面性和效率。更...
在人工智能的众多应用中,对于文档的准确召回是一个广泛使用的需求。例如,在基于阅读理解的问答系统(RAG)中,我们常常通过嵌入模型生成向量来进行语义方面的召回,这种方法已经证明了其效果良好。然而,这并不意味着该方法适用于所有场景。让我们考虑一个涉及语音处理的项目,用户可能会说出需要查询的内容,系统需要迅速召回与用户语音输入相关的文档。在这种情况下,系统的响应时间变得至关重要,任何延迟都可能影响用户体...
背景检索增强生成(RAG)迅速推进了语言模型领域,特别是在问答(QA)系统。通过在响应生成阶段集成外部文档,RAG显著提高了语言模型的准确性和可靠性。这种方法提高了响应的质量,并降低了幻觉的频率,其中模型生成了错误或误导性的信息。然而,这些方法表现出有限的检索精度时,面对众多的难以区分的文件,在其实际应用中提出了显着的挑战。为了应对这些新出现的挑战,本文提出HiQA,一个先进的多文档问答(MDQA)框架,集成...
GraphRag解决了什么问题在朴素的RAG(自我检索生成模型)中,我们使用一个向量库作为我们的知识库。当用户提出查询时,该系统从向量库中匹配顶部K个元素作为上下文,并将这个上下文与提示和查询一起交给大型语言模型(LLM)进行回答。现在,让我们假设这个向量库是指向企业知识的。有两个示例查询:xx产品的价格是多少?去年技术团队的成果有哪些?对于第一个问题,由于它是非常具体的,知识库的搜索可能会找到相应的信息块或常见...
今天,我要和你分享的是如何用GraphRAG从一个普通的txt文件中创建知识图谱,准备好了吗?那就让我们开始吧!GraphRAG解决了什么问题当你问:“这个数据集的主题是什么?”这类高级别、概括性的问题时,传统的RAG可能就会束手无策。为什么呢?那是因为这本质上是一个聚焦于查询的总结性任务(QueryFocusedSummarization,QFS),而不是一个明确的检索任务。我知道你现在可能在想,“那我们该如何解决这个问题呢?”好消息是,有人...