理解GraphRAG其实并不难,可以理解为由两个主要模块组成:
- 向量检索(Local Search)
- 局部知识图谱社区检索(Global Search)
所谓 GraphRAG 一定程度上可以理解为使用 LLM 生成知识图谱,在对复杂信息进行文档分析时可显著提高问答性能,尤其是在处理私有数据时。 GraphRAG构建流程主要是以下三个:
- 图表作为内容存储:提取相关文档块并要求 LLM 使用它们进行回答。这种变体需要一个包含相关文本内容和元数据的 KG,以及与矢量数据库的集成。
- Graph 作为主题专家:提取与自然语言 (NL) 问题相关的概念和实体的描述,并将其作为附加的“语义上下文”传递给 LLM。理想情况下,描述应包括概念之间的关系。这种变化需要具有全面概念模型的 KG,包括相关本体、分类法或其他实体描述。实现需要实体链接或其他机制来识别与问题相关的概念。
- 图表作为数据库:将 NL 问题(部分)映射到图表查询,执行查询并要求 LLM 总结结果。这种变化需要一个包含相关事实信息的图表。这种模式的实现需要某种 NL 到图表查询工具和实体链接。
下面分享一个GraphRAG+Langchain实现大模型知识图谱的笔记。








本文转载自公众号数字化助推器 作者:天涯咫尺TGH
原文链接:https://mp.weixin.qq.com/s/TkjJFEXbVAAVw40ZCq6UMg