VLDB（International Conference on Very Large Data Bases）是數(shù)據(jù)庫(kù)與數(shù)據(jù)管理領(lǐng)域最頂級(jí)、歷史最悠久的國(guó)際學(xué)術(shù)會(huì)議之一。作為探討數(shù)據(jù)管理、可擴(kuò)展數(shù)據(jù)科學(xué)、以及數(shù)據(jù)庫(kù)系統(tǒng)最新研究成果的全球首要論壇，該會(huì)議每年都會(huì)匯聚全球頂尖的學(xué)術(shù)界研究人員、工業(yè)界從業(yè)者、系統(tǒng)開(kāi)發(fā)者以及供應(yīng)商，共同探討數(shù)據(jù)科學(xué)領(lǐng)域的前沿創(chuàng)新與挑戰(zhàn)。VLDB 2026將在2026年8月31日-2026年9月4日在美國(guó)波士頓舉辦。

QA-GraphRAG: Query-Adaptive Plug-and-Play Retrieval Integration for Graph-based Retrieval-Augmented Generation

作者：Zeang Sheng, Ruihong Sun, Jiahao Xu, Hanmei Luo, Peng Chen, Wentao Zhang, Bin Cui

Github鏈接：https://github.com/PKU-DAIR/Query-Adaptive-GraphRAG

一、問(wèn)題背景與動(dòng)機(jī)

大型語(yǔ)言模型（LLMs）展現(xiàn)出了卓越的能力，但它們經(jīng)常遭受幻覺(jué)困擾，且缺乏最新的知識(shí)。檢索增強(qiáng)生成（RAG）通過(guò)將LLM與外部知識(shí)庫(kù)結(jié)合，有效緩解了這些局限性。傳統(tǒng)的基于向量的RAG在處理簡(jiǎn)單查詢(xún)時(shí)非常有效，但在處理需要多跳推理的復(fù)雜查詢(xún)時(shí)卻顯得力不從心。為了解決這一問(wèn)題，圖檢索增強(qiáng)生成（Graph-based RAG）框架應(yīng)運(yùn)而生，它通過(guò)構(gòu)建能夠捕捉全局關(guān)系并支持多跳推理的知識(shí)圖譜來(lái)提升問(wèn)答能力。

然而，現(xiàn)有的基于圖的RAG方法在處理簡(jiǎn)單的基于事實(shí)的查詢(xún)時(shí)，由于可能會(huì)丟失詳細(xì)的實(shí)體信息，其表現(xiàn)經(jīng)常不如基于向量的框架。近期的一些雙分支圖RAG框架試圖通過(guò)同時(shí)檢索局部和全局知識(shí)來(lái)解決這個(gè)問(wèn)題。但對(duì)所有查詢(xún)都不加區(qū)分地從兩個(gè)分支進(jìn)行檢索，會(huì)為許多簡(jiǎn)單查詢(xún)引入不必要的計(jì)算成本和冗余信息。針對(duì)這一痛點(diǎn)，如何讓圖RAG框架自動(dòng)識(shí)別查詢(xún)特性并動(dòng)態(tài)調(diào)整檢索策略，成為了進(jìn)一步提升系統(tǒng)性能與效率的核心問(wèn)題。

圖 1 一個(gè)典型的圖RAG層次化知識(shí)庫(kù)結(jié)構(gòu)

數(shù)據(jù)與框架層面的實(shí)證分析

為了深入揭示現(xiàn)有框架的性能瓶頸，我們從數(shù)據(jù)集和檢索框架兩個(gè)層面對(duì)基于圖的RAG進(jìn)行了系統(tǒng)性的實(shí)證分析。

1. 數(shù)據(jù)集層面分析（Inter- & Within-dataset Analysis）

我們首先利用大語(yǔ)言模型作為分類(lèi)器，將現(xiàn)有問(wèn)答基準(zhǔn)數(shù)據(jù)集中的查詢(xún)劃分為“局部（Local）”和“全局（Global）”兩類(lèi)。其中，“局部”查詢(xún)僅需要簡(jiǎn)單的事實(shí)相關(guān)知識(shí)，無(wú)需多跳或綜合分析能力；而“全局”查詢(xún)則需要更高層級(jí)的總結(jié)性知識(shí)，通常依賴(lài)多跳推理或全局合成能力。分析結(jié)果顯示：

圖 2 “局部”和“全局”查詢(xún)?cè)诓煌瑪?shù)據(jù)集中的比例

1）查詢(xún)分布的顯著差異：傳統(tǒng)的KGQA數(shù)據(jù)集（如MuSiQue、2WikiMQA、HotpotQA）主要由“局部”查詢(xún)主導(dǎo)（例如在2WikiMQA中，局部查詢(xún)占比高達(dá)82%）。相比之下，專(zhuān)門(mén)針對(duì)圖RAG的基準(zhǔn)測(cè)試 GraphRAG-Bench 在不同任務(wù)中表現(xiàn)出多樣化的趨勢(shì)，其中多選（MC）和填空（FB）任務(wù)幾乎全是局部查詢(xún)，而開(kāi)篇問(wèn)答（OE）和多選（MS）任務(wù)中全局查詢(xún)的比例顯著更高。

2）查詢(xún)屬性的量化表征：我們提出了兩個(gè)量化指標(biāo)來(lái)探索兩類(lèi)查詢(xún)的內(nèi)在屬性——問(wèn)答語(yǔ)義相似度和具體度（Specificity，衡量問(wèn)題中命名實(shí)體或大寫(xiě)詞元的比例）。實(shí)驗(yàn)表明，兩類(lèi)查詢(xún)?cè)谡Z(yǔ)義相似度上沒(méi)有實(shí)質(zhì)性區(qū)別；但在具體度上，“局部”查詢(xún)顯著高于“全局”查詢(xún)。這表明局部查詢(xún)往往涉及更具體的命名實(shí)體，需要更加精準(zhǔn)、細(xì)粒度的粒度知識(shí)來(lái)解決。

2. 框架層面分析（Framework-level Analysis）

接著，我們對(duì)比了不同檢索框架在兩類(lèi)查詢(xún)上的表現(xiàn)：

表 1 傳統(tǒng)KGQA數(shù)據(jù)集上圖RAG和傳統(tǒng)向量RAG的對(duì)比

1）圖RAG vs. 傳統(tǒng)向量RAG：在“局部”查詢(xún)主導(dǎo)的傳統(tǒng)KGQA數(shù)據(jù)集上，簡(jiǎn)單的向量檢索方法（如TF-IDF和BM25）在部分場(chǎng)景下甚至可以擊敗復(fù)雜的圖RAG框架（如GraphRAG和RAPTOR）。這表明在面對(duì)簡(jiǎn)單事實(shí)查詢(xún)時(shí)，圖RAG復(fù)雜的全局檢索機(jī)制不僅沒(méi)有帶來(lái)優(yōu)勢(shì)，反而可能引入了冗余噪聲。

表 2 GraphRAG-Bench上的對(duì)比結(jié)果

2）雙分支 vs. 單分支圖RAG：我們將最新的雙分支框架（TREX）與其退化的單分支變體進(jìn)行了對(duì)比。結(jié)果發(fā)現(xiàn)，僅保留局部檢索分支的變體（TREX-local）在局部查詢(xún)主導(dǎo)的任務(wù)上超越了完整的雙分支模型。同時(shí)，由于雙分支模型需要同時(shí)在兩個(gè)分支進(jìn)行檢索，其每條查詢(xún)的響應(yīng)時(shí)間顯著增加。

3. 實(shí)證分析總結(jié)：

上述分析表明，傳統(tǒng)向量檢索（或圖RAG的底層原始文本塊層級(jí)）更擅長(zhǎng)處理“局部”查詢(xún)，而多層級(jí)圖檢索則更擅長(zhǎng)處理“全局”查詢(xún)。如果一個(gè)圖RAG框架能夠根據(jù)查詢(xún)的內(nèi)在屬性自適應(yīng)地調(diào)整其檢索策略，就能同時(shí)在“局部”和“全局”查詢(xún)上取得最優(yōu)的性能與效率平衡。

二、QA-GraphRAG框架詳解

圖 3. QA-GraphRAG的工作流程示意圖

基于上述核心發(fā)現(xiàn)，我們提出了QA-GraphRAG：一個(gè)為基于圖的RAG框架設(shè)計(jì)的全新查詢(xún)自適應(yīng)即插即用檢索集成模塊。QA-GraphRAG能夠兼容大多數(shù)以層級(jí)方式構(gòu)建知識(shí)庫(kù)并檢索文本塊的現(xiàn)有圖RAG框架。QA-GraphRAG的核心是一個(gè)靈活的路由器（Router）模塊，它可以根據(jù)輸入查詢(xún)的特征，自適應(yīng)地預(yù)測(cè)并選擇最佳的起始知識(shí)檢索層級(jí)。該框架的部署分為兩個(gè)階段：離線預(yù)訓(xùn)練和在線推理。

1. 離線預(yù)訓(xùn)練：

為了在預(yù)測(cè)準(zhǔn)確率和在線推理延遲之間取得最佳平衡，我們借鑒了自動(dòng)機(jī)器學(xué)習(xí)中門(mén)控機(jī)制的設(shè)計(jì)直覺(jué)，采用一個(gè)輕量級(jí)的三層MLP（多層感知機(jī)）作為路由器的骨干模型。我們實(shí)現(xiàn)了兩種不同性能與成本權(quán)衡的路由器部署策略：

1) 跨領(lǐng)域預(yù)訓(xùn)練（Generalist router/通用路由器）：在包含HotpotQA、NQ和TriviaQA的6,000個(gè)多樣化樣本上進(jìn)行預(yù)訓(xùn)練。通過(guò)將不同層級(jí)檢索生成的答案準(zhǔn)確率得分轉(zhuǎn)換為 preference score 向量，并利用 Gumbel-Softmax 函數(shù)模擬硬選擇操作進(jìn)行訓(xùn)練。該策略使路由器具備了強(qiáng)大的跨領(lǐng)域泛化能力，且無(wú)需目標(biāo)領(lǐng)域的標(biāo)注數(shù)據(jù)。

2) 冷啟動(dòng)適應(yīng)（Specialist router/專(zhuān)家路由器）：當(dāng)目標(biāo)領(lǐng)域有少量小樣本查詢(xún)（如200個(gè)樣本）可用時(shí)，在通用路由器的基礎(chǔ)上進(jìn)行微調(diào)，從而定制出更適配目標(biāo)數(shù)據(jù)集特征的專(zhuān)用路由器。

2. 在線推理：

在線推理時(shí)，QA-GraphRAG通過(guò)以下四個(gè)連續(xù)步驟高效處理查詢(xún)：

1) 輸入處理：編碼模型將輸入的文本查詢(xún)轉(zhuǎn)換為語(yǔ)義豐富的嵌入向量。

2) 自適應(yīng)路由：預(yù)訓(xùn)練的MLP路由器基于查詢(xún)嵌入，瞬時(shí)預(yù)測(cè)出當(dāng)前查詢(xún)最合適的檢索起始知識(shí)層級(jí)（由于MLP計(jì)算極快，引入的時(shí)間開(kāi)銷(xiāo)微乎其微）。

3) 信息檢索：檢索器接收路由器的層級(jí)決策，從知識(shí)圖譜對(duì)應(yīng)的層級(jí)開(kāi)始向下遍歷并檢索相關(guān)文本塊，從而避免了不必要的頂層抽象匯總或底層冗余搜索。

4) 答案生成：生成器（LLM）整合查詢(xún)與精準(zhǔn)檢索到的上下文，生成最終的高質(zhì)量答案。

三、實(shí)驗(yàn)結(jié)果

我們?cè)诔Ｒ?guī)的知識(shí)圖譜問(wèn)答（KGQA）數(shù)據(jù)集和專(zhuān)門(mén)針對(duì)圖RAG的GraphRAG-Bench基準(zhǔn)測(cè)試上進(jìn)行了廣泛的實(shí)驗(yàn)，并選擇Qwen2.5-7B-Instruct作為默認(rèn)的骨干LLM。實(shí)驗(yàn)評(píng)估了將QA-GraphRAG集成到現(xiàn)有五種主流圖RAG框架（GraphRAG、RAPTOR、LightRAG、TREX、HiRAG）中的表現(xiàn)。

表 3 整體性能實(shí)驗(yàn)對(duì)比結(jié)果

1. 整體性能顯著提升：

評(píng)估結(jié)果表明，所有集成了QA-GraphRAG的變體（帶有“-QA”后綴）在其對(duì)應(yīng)的原始變體基礎(chǔ)上均取得了顯著的性能提升。例如，在MuSiQue數(shù)據(jù)集上，原始的GraphRAG由于檢索策略固定表現(xiàn)欠佳，甚至被傳統(tǒng)的BM25超越；但在集成QA-GraphRAG后，GraphRAG-QA不僅大幅超越了原始版本，還成功超越了傳統(tǒng)檢索方法。

表 4 不同路由骨干模型、算法的實(shí)驗(yàn)對(duì)比

2. 路由骨干模型與基線的高效性對(duì)比：

我們將QA-GraphRAG（使用MLP作為路由）與使用LLM（Qwen2.5-3B-Instruct）作為路由以及最新的自適應(yīng)檢索方法（Self-RAG、SeaKR）進(jìn)行了對(duì)比分析。

1) 對(duì)比LLM路由：實(shí)驗(yàn)發(fā)現(xiàn)，使用LLM作為路由并沒(méi)有帶來(lái)一致的性能優(yōu)勢(shì)，反而引入了顯著的推理延遲，導(dǎo)致每條查詢(xún)的耗時(shí)大幅增加。MLP在保證效果的同時(shí)兼顧了極高的查詢(xún)效率。

2) 對(duì)比自適應(yīng)檢索：相比于Self-RAG和SeaKR在某些情況下需要進(jìn)行多次繁瑣的檢索調(diào)用，QA-GraphRAG對(duì)每個(gè)查詢(xún)僅需執(zhí)行單次檢索調(diào)用即可精確定位知識(shí)層級(jí)，從而大幅降低了平均檢索成本和時(shí)間開(kāi)銷(xiāo)。

表 5 不同LLM基座模型的實(shí)驗(yàn)對(duì)比

3. LLM基座選擇分析：

為了探究檢索策略與大模型參數(shù)量之間的關(guān)系，我們將底層的LLM從7B（Qwen2.5-7B-Instruct）替換為14B版本。正如預(yù)期，14B模型整體表現(xiàn)更優(yōu)。然而，令人驚喜的是，裝備了QA-GraphRAG的7B變體（如GraphRAG-QA-7B），在HotpotQA數(shù)據(jù)集和TF任務(wù)上的表現(xiàn)，甚至超越了使用更強(qiáng)大14B模型的原始框架（GraphRAG-14B）。這一“越級(jí)”表現(xiàn)強(qiáng)有力地證明了：一個(gè)聰明的自適應(yīng)檢索策略，完全可以在一定程度上彌補(bǔ)底層大模型參數(shù)規(guī)模的劣勢(shì)。

表 6 不同路由器部署策略的實(shí)驗(yàn)對(duì)比

4. 路由器部署策略的泛化性：

我們?cè)u(píng)估了通用路由器（Generalist router）與專(zhuān)家路由器（Specialist router）的差異。結(jié)果顯示，僅在外部公開(kāi)數(shù)據(jù)集上訓(xùn)練的通用路由器，其性能穩(wěn)定超越了僅在目標(biāo)數(shù)據(jù)集（如HotpotQA）上訓(xùn)練的單領(lǐng)域路由器，證明了跨領(lǐng)域預(yù)訓(xùn)練能有效增強(qiáng)模型對(duì)通用查詢(xún)特征的捕獲與泛化能力。而提供少量目標(biāo)數(shù)據(jù)微調(diào)的專(zhuān)家路由器則能在通用版的基礎(chǔ)上進(jìn)一步提供適度的精度提升，為實(shí)際部署提供了靈活的成本-性能權(quán)衡方案。

圖 4 “局部”和“全局”查詢(xún)各自的性能對(duì)比

5. 路由決策的細(xì)粒度分析：

我們對(duì)通用路由器在實(shí)際查詢(xún)中的決策層級(jí)進(jìn)行了案例分析。結(jié)果表明，路由器的輸出與人類(lèi)直覺(jué)高度一致。此外，我們將數(shù)據(jù)集拆分為“局部”和“全局”后分別進(jìn)行評(píng)估。如圖3所示，QA-GraphRAG不僅提升了原本就不擅長(zhǎng)的局部查詢(xún)表現(xiàn)，同時(shí)還在全局查詢(xún)上帶來(lái)了性能增益，證明了它能游刃有余地處理跨數(shù)據(jù)集的各種復(fù)雜查詢(xún)類(lèi)型。

四、總結(jié)

現(xiàn)有的基于圖的RAG框架在應(yīng)對(duì)多樣化的查詢(xún)需求時(shí)，往往受限于固定的檢索策略，導(dǎo)致“局部”查詢(xún)效率低下或“全局”查詢(xún)總結(jié)不足。為解決這一痛點(diǎn)，我們提出了QA-GraphRAG，這是一種即插即用、具有查詢(xún)自適應(yīng)能力的檢索集成框架。它能夠敏銳感知查詢(xún)的具體度與語(yǔ)義特征，幫助現(xiàn)有的圖RAG框架自適應(yīng)地選擇最合適的檢索深度。在各大基準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)均表明，我們的方法顯著增強(qiáng)了現(xiàn)有框架的問(wèn)答表現(xiàn)，為圖增強(qiáng)的通用檢索系統(tǒng)設(shè)計(jì)提供了一條高能效的新路徑。

參考文獻(xiàn)

Darren Edge, Ha Trinh, Newman Cheng, Joshua Bradley, Alex Chao, Apurva Mody, Steven Truitt, Dasha Metropolitansky, Robert Osazuwa Ness, and Jonathan Larson. 2024. From local to global: A graph rag approach to query-focused summarization. arXiv preprint arXiv:2404.16130 (2024).
Parth Sarthi, Salman Abdullah, Aditi Tuli, Shubh Khanna, Anna Goldie, and Christopher D. Manning. Raptor: Recursive abstractive processing for tree-organized retrieval. In The Twelfth International Conference on Learning Representations.
Yilin Xiao, Junnan Dong, Chuang Zhou, Su Dong, Qian-wen Zhang, Di Yin, Xing Sun, and Xiao Huang. 2025. GraphRAG-Bench: Challenging Domain-Specific Reasoning for Evaluating Graph Retrieval-Augmented Generation. arXiv preprint arXiv:2506.02404 (2025).
Joyce Cahoon, Prerna Singh, Nick Litombe, Jonathan Larson, Ha Trinh, Yiwen Zhu, Andreas Mueller, Fotis Psallidas, and Carlo Curino. 2025. Optimizing open-domain question answering with graph-based retrieval augmented generation. In Proceedings of the 1st workshop connecting academia and industry on Modern Integrated Database and AI Systems. 1-11.

實(shí)驗(yàn)室簡(jiǎn)介

北京大學(xué)數(shù)據(jù)與智能實(shí)驗(yàn)室（Data And Intelligence Research Lab at Peking Univeristy，PKU-DAIR實(shí)驗(yàn)室）由北京大學(xué)計(jì)算機(jī)學(xué)院崔斌教授領(lǐng)導(dǎo)，長(zhǎng)期從事數(shù)據(jù)庫(kù)系統(tǒng)、大數(shù)據(jù)管理與分析、人工智能等領(lǐng)域的前沿研究，在理論和技術(shù)創(chuàng)新以及系統(tǒng)研發(fā)上取得多項(xiàng)成果，已在國(guó)際頂級(jí)學(xué)術(shù)會(huì)議和期刊發(fā)表學(xué)術(shù)論文200余篇，發(fā)布多個(gè)開(kāi)源項(xiàng)目。課題組同學(xué)曾數(shù)十次獲得包括CCF優(yōu)博、ACM中國(guó)優(yōu)博、北大優(yōu)博、微軟學(xué)者、蘋(píng)果獎(jiǎng)學(xué)金、谷歌獎(jiǎng)學(xué)金等榮譽(yù)。PKU-DAIR實(shí)驗(yàn)室持續(xù)與工業(yè)界展開(kāi)卓有成效的合作，與騰訊、阿里巴巴、蘋(píng)果、微軟、百度、快手、中興通訊等多家知名企業(yè)開(kāi)展項(xiàng)目合作和前沿探索，解決實(shí)際問(wèn)題，進(jìn)行科研成果的轉(zhuǎn)化落地。

麻豆精品无码av,欧美1区2区,久久中文字幕乱码人妻,亚洲欧美另类少妇精品,在线看黄射,69pao高清,九九九久久久国产精品,子操大逼1234区,九九爱99热精品

VLDB 2026 |QA-GraphRAG：面向圖檢索增強(qiáng)生成的查詢(xún)自適應(yīng)即插即用檢索框架

實(shí)驗(yàn)室簡(jiǎn)介

評(píng)論 0

近期熱門(mén)新聞

下一篇