准确率飙升！Graph RAG如何利用知识图谱提升RAG答案质量（三）—

温馨提示

本分享为系列知识分享，预期分为四节：

GraphRAG是什么

GraphRAG图谱构建详细步骤

GraphRAG检索查询详细步骤

微软GraphRAG 代码实战

本分享为第三小节 GraphRAG检索查询详细步骤，大家读完感兴趣可订阅专栏，掌握GraphRAG的技术核心与实战指南~。

前言

上篇文章我们花费了大量篇幅分享GraphRAG是如何将文本构建为知识图谱的。GraphRAG构建好知识图谱后，下一步就是要依托构建好的知识图谱来检索相关信息并生成回答。接下来我们就一起来看看GraphRAG检索回答的详细步骤~

一、详细步骤

GraphRAG查询阶段的核心任务是基于构建好的知识图谱检索信息并生成回答。具体来说查询阶段会利用之前知识图谱构建阶段的所有实体、关系和社区报告等信息，结合用户的查询请求，自动选择相关上下文，通过大语言模型（如DeepSeek、Qwen等）生成智能化的回答，详细流程如下：

用户输入查询(User Query): 用户通过输入一个自然语言查询，表达他们需要的信息。

创建查询上下文(BuildQueryContext): GraphRAG会根据查询的内容，从知识图谱中提取相关的信息并构建查询上下文。这个上下文包括了与查询相关的:

文本单元(TextUnits):

实体(Entities):

关系(Relationships):

上下文构建的过程中，GraphRAG会根据预设的参数(如文本单元占比、实体数量等)来选择最相关的文本片段、实体、关系等，以便提供一个完整的上下文。

文本嵌入(Text Embedding)：

文本嵌入模型(Embedding模型)

一文带你了解RAG核心原理

构建查询上下文(LocalContext): GraphRAG将结合以下因素构建查询上下文:

查询相关的文本单元(即与查询最相关的文本片段);查询相关的实体(从实体表中选取相关的实体);查询相关的关系(从关系表中选取与查询相关的关系);社区报告(有时也会包含相关的社区报告信息，帮助理解文本和实体的聚合关系)这些信息会被组合在一起，形成一个“上下文窗口”，为后续的查询提供支持。在不同的查询中，GraphRAG会根据用户提示词具体的需求调整上下文的构建方式，例如调整文本单元和社区报告的比例，或者增加对历史对话的考虑。

检索并选择相关信息(RetrieveRelevantInformation): 通过构建好的查询上下文，GraphRAG会检索并从中选择最相关的文本单元、实体和关系。这个过程的目的是通过“局部搜索”算法找到与用户查询最相关的信息，并确定哪些是能够提供解答的关键内容。

大语言模型生成答案(AnswerGenerationbyLLM): 结合检索到的上下文信息，GraphRAG使用一个大型语言模型(如GPT、DeepSeek、Qwen3)来生成最终的回答。模型会根据检索到的上下文生成自然语言的回应，并根据查询的需要决定回答的格式和内容，例如:

简单回答:如“维克托·迈尔-舍恩伯格是《大数据时代》的作者之一。详细报告:如“一、本书讨论了数据科学的应用，二、维克托·迈尔-舍恩伯格作为作者之一提出了….

生成的答案可以根据查询的复杂度有所不同，通常会包含多段文字、按优先级排序的答案等。

返回查询结果(ReturnResults): GraphRAG将生成的答案返回给用户。如果设置了“返回候选上下文”(return_candidate context=True )还会返回所有相关候选的实体、关系和文本单元，供用户参考。

以上是GraphRAG 查询检索的详细步骤。只讲概念大家难以在脑海中建立直观的认识，大家可以先阅读了解这部分的基本流程，然后再结合下一节的案例展示加深对流程的理解。

二、案例展示

下面我们同样通过GraphRAG图谱构建详细步骤中的案例向大家详细描述GraphRAG查询阶段的基本流程，输入GraphRAG的文本如下：

《大数据时代》是一本由维克托·迈尔-舍恩伯格与肯尼斯·库克耶合著的书籍，讨论了如何在海量数据中挖掘出有价值的信息。这本书深入探讨了数据科学的应用，并阐述了数据分析和预测在各行各业中的影响力。在书中，作者举了许多实际例子，说明大数据如何改变我们的生活，甚至如何预测未来的趋势。

该文本首先经过GraphRAG的文本切分步骤得到文本块表如下：

id	human_readable_id	text	n_tokens	document_ids
t1	text_unit_1	《大数据时代》是一本由维克托·迈尔-舍恩伯格与肯尼斯·库克耶合著的书籍，讨论了如何在海量数据中挖掘出有价值的信息。	50	doc_1
t2	text_unit_2	这本书深入探讨了数据科学的应用，并阐述了数据分析和预测在各行各业中的影响力。	50	doc_1
t3	text_unit_3	在书中，作者举了许多实际例子，说明大数据如何改变我们的生活，甚至如何预测未来的趋势。	50	doc_1

同时还会经过实体识别、关系挖掘、社区报告构建步骤生成实体表、关系表、实体关系表、社区报告表等，这些表都将作用于接下来用户的查询检索。

假设用户输入查询：告诉我《大数据时代》的核心是什么？，GraphRAG会依据用户设置的查询模式（这是传统RAG中不涉及的概念）构建上下文，不同查询模式构建上下文并产生回答的过程如下：

3.1 本地模式：

查找用户实体：

《大数据时代》

维克托·迈尔-舍恩伯格

数据科学

构建查询上下文：

实体表

实体关系表

文本块

嵌入和相似度计算：

生成答案：

返回结果：

3.2 全局模式：

查找社区报告： 全局模式先从社区报告出发。回看上一篇文章GraphRAG图谱构建详细步骤中我们针对以上文本生成两个社区报告：

核心社区报告（community 1):

社区lD:

level:

title:

summary:

full_content:

rank:

rank_explanation:

findings:

full content json:

period:

size:

外围社区报告（community 2):

社区ID:

level:

title:

summary:

full content:

rank:

rank_explanation:

full content json:

period:

size:

很显然问题和核心社区报告community_1特别相似（核心社区报告已经符合用户提问的主题，可见全局模式查找更精确一些），GraphRAG从核心社区报告community_1出发找到大数据时代和数据科学这两个实体，再从实体表、实体关系表去查找与这两个实体关联的实体和关系。

构建查询上下文： 选定大数据时代和数据科学两个实体后，通过实体表找到关联实体，通过实体关系表找到关联关系，同时还要找到相关实体的文本块。因为我们举例的文本比较简单，可见切分后的三个文本块都与问题有直接或间接关联，所以都会被纳入查询上下文中。

嵌入和相似度计算： 对选出的文本块、实体和关系进行嵌入转换，计算与查询的相似度，找到最相关的信息。

生成答案： 大语言模型基于这些信息生成一个回答：“《大模型时代》的核心思想是数据的价值，它将影响未来的各个领域。”

返回结果： 返回用户查询的结果。

3.3 传统RAG

如果是传统RAG，它的检索查询过程是怎样的呢？

我们都知道传统RAG查询不会构建知识图谱，只会进行文本块切分步骤。传统RAG会直接对切分后的文本块进行搜索，结果发现只有 文本块1 包含《大数据时代》这个名词，和用户的问题类似，所以大模型在构建上下文的过程中只会考虑到文本块1的信息，自然就不能全面的考虑文本内容了。

四、总结

GraphRAG的查询阶段依赖于索引阶段构建的知识图谱，利用大语言模型和嵌入技术，从大量的文本单元、实体和关系中构建出一个查询上下文，然后生成相关的答案。在查询过程中，GraphRAG不仅可以使用传统的信息检索方法(如相似度计算)，还通过知识图谱加强了上下文关联性，搭配大语言模型提供智能化的回答，是目前性能强大的RAG系统。

我们GraphRAG的理论篇到本篇分享就结束啦，从下一篇开始我们将针对微软开源的GraphRAG项目上手实战，在项目中感受GraphRAG的独特魅力。大家读完感兴趣可关注笔者掘金账号和专栏，更可关注笔者的同名微信公众号：大模型真好玩，免费获得笔者工作实践中的各种资料~

温馨提示

前言

一、详细步骤

二、案例展示

3.1 本地模式：

3.2 全局模式：

3.3 传统RAG

四、总结

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签