VLDB(International Conference on Very Large Data Bases)是數(shù)據(jù)庫(kù)與數(shù)據(jù)管理領(lǐng)域最頂級(jí)、歷史最悠久的國(guó)際學(xué)術(shù)會(huì)議之一。作為探討數(shù)據(jù)管理、可擴(kuò)展數(shù)據(jù)科學(xué)、以及數(shù)據(jù)庫(kù)系統(tǒng)最新研究成果的全球首要論壇,該會(huì)議每年都會(huì)匯聚全球頂尖的學(xué)術(shù)界研究人員、工業(yè)界從業(yè)者、系統(tǒng)開(kāi)發(fā)者以及供應(yīng)商,共同探討數(shù)據(jù)科學(xué)領(lǐng)域的前沿創(chuàng)新與挑戰(zhàn)。VLDB 2026將在2026年8月31日-2026年9月4日在美國(guó)波士頓舉辦。
QA-GraphRAG: Query-Adaptive Plug-and-Play Retrieval Integration for Graph-based Retrieval-Augmented Generation
作 者:Zeang Sheng, Ruihong Sun, Jiahao Xu, Hanmei Luo, Peng Chen, Wentao Zhang, Bin Cui
Github鏈接:https://github.com/PKU-DAIR/Query-Adaptive-GraphRAG
一、 問(wèn)題背景與動(dòng)機(jī)
大型語(yǔ)言模型(LLMs)展現(xiàn)出了卓越的能力,但它們經(jīng)常遭受幻覺(jué)困擾,且缺乏最新的知識(shí)。檢索增強(qiáng)生成(RAG)通過(guò)將LLM與外部知識(shí)庫(kù)結(jié)合,有效緩解了這些局限性。傳統(tǒng)的基于向量的RAG在處理簡(jiǎn)單查詢(xún)時(shí)非常有效,但在處理需要多跳推理的復(fù)雜查詢(xún)時(shí)卻顯得力不從心。為了解決這一問(wèn)題,圖檢索增強(qiáng)生成(Graph-based RAG)框架應(yīng)運(yùn)而生,它通過(guò)構(gòu)建能夠捕捉全局關(guān)系并支持多跳推理的知識(shí)圖譜來(lái)提升問(wèn)答能力。
然而,現(xiàn)有的基于圖的RAG方法在處理簡(jiǎn)單的基于事實(shí)的查詢(xún)時(shí),由于可能會(huì)丟失詳細(xì)的實(shí)體信息,其表現(xiàn)經(jīng)常不如基于向量的框架。近期的一些雙分支圖RAG框架試圖通過(guò)同時(shí)檢索局部和全局知識(shí)來(lái)解決這個(gè)問(wèn)題。但對(duì)所有查詢(xún)都不加區(qū)分地從兩個(gè)分支進(jìn)行檢索,會(huì)為許多簡(jiǎn)單查詢(xún)引入不必要的計(jì)算成本和冗余信息。針對(duì)這一痛點(diǎn),如何讓圖RAG框架自動(dòng)識(shí)別查詢(xún)特性并動(dòng)態(tài)調(diào)整檢索策略,成為了進(jìn)一步提升系統(tǒng)性能與效率的核心問(wèn)題。

圖 1 一個(gè)典型的圖RAG層次化知識(shí)庫(kù)結(jié)構(gòu)
數(shù)據(jù)與框架層面的實(shí)證分析
為了深入揭示現(xiàn)有框架的性能瓶頸,我們從數(shù)據(jù)集和檢索框架兩個(gè)層面對(duì)基于圖的RAG進(jìn)行了系統(tǒng)性的實(shí)證分析。
1. 數(shù)據(jù)集層面分析(Inter- & Within-dataset Analysis)
我們首先利用大語(yǔ)言模型作為分類(lèi)器,將現(xiàn)有問(wèn)答基準(zhǔn)數(shù)據(jù)集中的查詢(xún)劃分為“局部(Local)”和“全局(Global)”兩類(lèi)。其中,“局部”查詢(xún)僅需要簡(jiǎn)單的事實(shí)相關(guān)知識(shí),無(wú)需多跳或綜合分析能力;而“全局”查詢(xún)則需要更高層級(jí)的總結(jié)性知識(shí),通常依賴(lài)多跳推理或全局合成能力。分析結(jié)果顯示:

圖 2 “局部”和“全局”查詢(xún)?cè)诓煌瑪?shù)據(jù)集中的比例
1)查詢(xún)分布的顯著差異:傳統(tǒng)的KGQA數(shù)據(jù)集(如MuSiQue、2WikiMQA、HotpotQA)主要由“局部”查詢(xún)主導(dǎo)(例如在2WikiMQA中,局部查詢(xún)占比高達(dá)82%)。相比之下,專(zhuān)門(mén)針對(duì)圖RAG的基準(zhǔn)測(cè)試 GraphRAG-Bench 在不同任務(wù)中表現(xiàn)出多樣化的趨勢(shì),其中多選(MC)和填空(FB)任務(wù)幾乎全是局部查詢(xún),而開(kāi)篇問(wèn)答(OE)和多選(MS)任務(wù)中全局查詢(xún)的比例顯著更高。
2)查詢(xún)屬性的量化表征:我們提出了兩個(gè)量化指標(biāo)來(lái)探索兩類(lèi)查詢(xún)的內(nèi)在屬性——問(wèn)答語(yǔ)義相似度和具體度(Specificity,衡量問(wèn)題中命名實(shí)體或大寫(xiě)詞元的比例)。實(shí)驗(yàn)表明,兩類(lèi)查詢(xún)?cè)谡Z(yǔ)義相似度上沒(méi)有實(shí)質(zhì)性區(qū)別;但在具體度上,“局部”查詢(xún)顯著高于“全局”查詢(xún)。這表明局部查詢(xún)往往涉及更具體的命名實(shí)體,需要更加精準(zhǔn)、細(xì)粒度的粒度知識(shí)來(lái)解決。
2. 框架層面分析(Framework-level Analysis)
接著,我們對(duì)比了不同檢索框架在兩類(lèi)查詢(xún)上的表現(xiàn):
表 1 傳統(tǒng)KGQA數(shù)據(jù)集上圖RAG和傳統(tǒng)向量RAG的對(duì)比

1)圖RAG vs. 傳統(tǒng)向量RAG:在“局部”查詢(xún)主導(dǎo)的傳統(tǒng)KGQA數(shù)據(jù)集上,簡(jiǎn)單的向量檢索方法(如TF-IDF和BM25)在部分場(chǎng)景下甚至可以擊敗復(fù)雜的圖RAG框架(如GraphRAG和RAPTOR)。這表明在面對(duì)簡(jiǎn)單事實(shí)查詢(xún)時(shí),圖RAG復(fù)雜的全局檢索機(jī)制不僅沒(méi)有帶來(lái)優(yōu)勢(shì),反而可能引入了冗余噪聲。
表 2 GraphRAG-Bench上的對(duì)比結(jié)果

2)雙分支 vs. 單分支圖RAG:我們將最新的雙分支框架(TREX)與其退化的單分支變體進(jìn)行了對(duì)比。結(jié)果發(fā)現(xiàn),僅保留局部檢索分支的變體(TREX-local)在局部查詢(xún)主導(dǎo)的任務(wù)上超越了完整的雙分支模型。同時(shí),由于雙分支模型需要同時(shí)在兩個(gè)分支進(jìn)行檢索,其每條查詢(xún)的響應(yīng)時(shí)間顯著增加。
3. 實(shí)證分析總結(jié):
上述分析表明,傳統(tǒng)向量檢索(或圖RAG的底層原始文本塊層級(jí))更擅長(zhǎng)處理“局部”查詢(xún),而多層級(jí)圖檢索則更擅長(zhǎng)處理“全局”查詢(xún)。如果一個(gè)圖RAG框架能夠根據(jù)查詢(xún)的內(nèi)在屬性自適應(yīng)地調(diào)整其檢索策略,就能同時(shí)在“局部”和“全局”查詢(xún)上取得最優(yōu)的性能與效率平衡。
二、QA-GraphRAG框架詳解

圖 3. QA-GraphRAG的工作流程示意圖
基于上述核心發(fā)現(xiàn),我們提出了QA-GraphRAG:一個(gè)為基于圖的RAG框架設(shè)計(jì)的全新查詢(xún)自適應(yīng)即插即用檢索集成模塊。QA-GraphRAG能夠兼容大多數(shù)以層級(jí)方式構(gòu)建知識(shí)庫(kù)并檢索文本塊的現(xiàn)有圖RAG框架。QA-GraphRAG的核心是一個(gè)靈活的路由器(Router)模塊,它可以根據(jù)輸入查詢(xún)的特征,自適應(yīng)地預(yù)測(cè)并選擇最佳的起始知識(shí)檢索層級(jí)。該框架的部署分為兩個(gè)階段:離線預(yù)訓(xùn)練和在線推理。
1. 離線預(yù)訓(xùn)練:
為了在預(yù)測(cè)準(zhǔn)確率和在線推理延遲之間取得最佳平衡,我們借鑒了自動(dòng)機(jī)器學(xué)習(xí)中門(mén)控機(jī)制的設(shè)計(jì)直覺(jué),采用一個(gè)輕量級(jí)的三層MLP(多層感知機(jī))作為路由器的骨干模型 。我們實(shí)現(xiàn)了兩種不同性能與成本權(quán)衡的路由器部署策略:
1) 跨領(lǐng)域預(yù)訓(xùn)練(Generalist router/通用路由器):在包含HotpotQA、NQ和TriviaQA的6,000個(gè)多樣化樣本上進(jìn)行預(yù)訓(xùn)練。通過(guò)將不同層級(jí)檢索生成的答案準(zhǔn)確率得分轉(zhuǎn)換為 preference score 向量,并利用 Gumbel-Softmax 函數(shù)模擬硬選擇操作進(jìn)行訓(xùn)練。該策略使路由器具備了強(qiáng)大的跨領(lǐng)域泛化能力,且無(wú)需目標(biāo)領(lǐng)域的標(biāo)注數(shù)據(jù)。
2) 冷啟動(dòng)適應(yīng)(Specialist router/專(zhuān)家路由器):當(dāng)目標(biāo)領(lǐng)域有少量小樣本查詢(xún)(如200個(gè)樣本)可用時(shí),在通用路由器的基礎(chǔ)上進(jìn)行微調(diào),從而定制出更適配目標(biāo)數(shù)據(jù)集特征的專(zhuān)用路由器。
2. 在線推理:
在線推理時(shí),QA-GraphRAG通過(guò)以下四個(gè)連續(xù)步驟高效處理查詢(xún):
1) 輸入處理:編碼模型將輸入的文本查詢(xún)轉(zhuǎn)換為語(yǔ)義豐富的嵌入向量。
2) 自適應(yīng)路由:預(yù)訓(xùn)練的MLP路由器基于查詢(xún)嵌入,瞬時(shí)預(yù)測(cè)出當(dāng)前查詢(xún)最合適的檢索起始知識(shí)層級(jí)(由于MLP計(jì)算極快,引入的時(shí)間開(kāi)銷(xiāo)微乎其微)。
3) 信息檢索:檢索器接收路由器的層級(jí)決策,從知識(shí)圖譜對(duì)應(yīng)的層級(jí)開(kāi)始向下遍歷并檢索相關(guān)文本塊,從而避免了不必要的頂層抽象匯總或底層冗余搜索。
4) 答案生成:生成器(LLM)整合查詢(xún)與精準(zhǔn)檢索到的上下文,生成最終的高質(zhì)量答案。
三、實(shí)驗(yàn)結(jié)果
我們?cè)诔R?guī)的知識(shí)圖譜問(wèn)答(KGQA)數(shù)據(jù)集和專(zhuān)門(mén)針對(duì)圖RAG的GraphRAG-Bench基準(zhǔn)測(cè)試上進(jìn)行了廣泛的實(shí)驗(yàn),并選擇Qwen2.5-7B-Instruct作為默認(rèn)的骨干LLM。實(shí)驗(yàn)評(píng)估了將QA-GraphRAG集成到現(xiàn)有五種主流圖RAG框架(GraphRAG、RAPTOR、LightRAG、TREX、HiRAG)中的表現(xiàn)。
表 3 整體性能實(shí)驗(yàn)對(duì)比結(jié)果

1. 整體性能顯著提升:
評(píng)估結(jié)果表明,所有集成了QA-GraphRAG的變體(帶有“-QA”后綴)在其對(duì)應(yīng)的原始變體基礎(chǔ)上均取得了顯著的性能提升。例如,在MuSiQue數(shù)據(jù)集上,原始的GraphRAG由于檢索策略固定表現(xiàn)欠佳,甚至被傳統(tǒng)的BM25超越;但在集成QA-GraphRAG后,GraphRAG-QA不僅大幅超越了原始版本,還成功超越了傳統(tǒng)檢索方法。
表 4 不同路由骨干模型、算法的實(shí)驗(yàn)對(duì)比

2. 路由骨干模型與基線的高效性對(duì)比:
我們將QA-GraphRAG(使用MLP作為路由)與使用LLM(Qwen2.5-3B-Instruct)作為路由以及最新的自適應(yīng)檢索方法(Self-RAG、SeaKR)進(jìn)行了對(duì)比分析。
1) 對(duì)比LLM路由:實(shí)驗(yàn)發(fā)現(xiàn),使用LLM作為路由并沒(méi)有帶來(lái)一致的性能優(yōu)勢(shì),反而引入了顯著的推理延遲,導(dǎo)致每條查詢(xún)的耗時(shí)大幅增加。MLP在保證效果的同時(shí)兼顧了極高的查詢(xún)效率。
2) 對(duì)比自適應(yīng)檢索:相比于Self-RAG和SeaKR在某些情況下需要進(jìn)行多次繁瑣的檢索調(diào)用,QA-GraphRAG對(duì)每個(gè)查詢(xún)僅需執(zhí)行單次檢索調(diào)用即可精確定位知識(shí)層級(jí),從而大幅降低了平均檢索成本和時(shí)間開(kāi)銷(xiāo)。
表 5 不同LLM基座模型的實(shí)驗(yàn)對(duì)比

3. LLM基座選擇分析:
為了探究檢索策略與大模型參數(shù)量之間的關(guān)系,我們將底層的LLM從7B(Qwen2.5-7B-Instruct)替換為14B版本。正如預(yù)期,14B模型整體表現(xiàn)更優(yōu)。然而,令人驚喜的是,裝備了QA-GraphRAG的7B變體(如GraphRAG-QA-7B),在HotpotQA數(shù)據(jù)集和TF任務(wù)上的表現(xiàn),甚至超越了使用更強(qiáng)大14B模型的原始框架(GraphRAG-14B)。這一“越級(jí)”表現(xiàn)強(qiáng)有力地證明了:一個(gè)聰明的自適應(yīng)檢索策略,完全可以在一定程度上彌補(bǔ)底層大模型參數(shù)規(guī)模的劣勢(shì)。
表 6 不同路由器部署策略的實(shí)驗(yàn)對(duì)比

4. 路由器部署策略的泛化性:
我們?cè)u(píng)估了通用路由器(Generalist router)與專(zhuān)家路由器(Specialist router)的差異。結(jié)果顯示,僅在外部公開(kāi)數(shù)據(jù)集上訓(xùn)練的通用路由器,其性能穩(wěn)定超越了僅在目標(biāo)數(shù)據(jù)集(如HotpotQA)上訓(xùn)練的單領(lǐng)域路由器,證明了跨領(lǐng)域預(yù)訓(xùn)練能有效增強(qiáng)模型對(duì)通用查詢(xún)特征的捕獲與泛化能力。而提供少量目標(biāo)數(shù)據(jù)微調(diào)的專(zhuān)家路由器則能在通用版的基礎(chǔ)上進(jìn)一步提供適度的精度提升,為實(shí)際部署提供了靈活的成本-性能權(quán)衡方案。

圖 4 “局部”和“全局”查詢(xún)各自的性能對(duì)比
5. 路由決策的細(xì)粒度分析:
我們對(duì)通用路由器在實(shí)際查詢(xún)中的決策層級(jí)進(jìn)行了案例分析。結(jié)果表明,路由器的輸出與人類(lèi)直覺(jué)高度一致。此外,我們將數(shù)據(jù)集拆分為“局部”和“全局”后分別進(jìn)行評(píng)估。如圖3所示,QA-GraphRAG不僅提升了原本就不擅長(zhǎng)的局部查詢(xún)表現(xiàn),同時(shí)還在全局查詢(xún)上帶來(lái)了性能增益,證明了它能游刃有余地處理跨數(shù)據(jù)集的各種復(fù)雜查詢(xún)類(lèi)型。
四、總結(jié)
現(xiàn)有的基于圖的RAG框架在應(yīng)對(duì)多樣化的查詢(xún)需求時(shí),往往受限于固定的檢索策略,導(dǎo)致“局部”查詢(xún)效率低下或“全局”查詢(xún)總結(jié)不足。為解決這一痛點(diǎn),我們提出了QA-GraphRAG,這是一種即插即用、具有查詢(xún)自適應(yīng)能力的檢索集成框架。它能夠敏銳感知查詢(xún)的具體度與語(yǔ)義特征,幫助現(xiàn)有的圖RAG框架自適應(yīng)地選擇最合適的檢索深度。在各大基準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)均表明,我們的方法顯著增強(qiáng)了現(xiàn)有框架的問(wèn)答表現(xiàn),為圖增強(qiáng)的通用檢索系統(tǒng)設(shè)計(jì)提供了一條高能效的新路徑。
參考文獻(xiàn)
- Darren Edge, Ha Trinh, Newman Cheng, Joshua Bradley, Alex Chao, Apurva Mody, Steven Truitt, Dasha Metropolitansky, Robert Osazuwa Ness, and Jonathan Larson. 2024. From local to global: A graph rag approach to query-focused summarization. arXiv preprint arXiv:2404.16130 (2024).
- Parth Sarthi, Salman Abdullah, Aditi Tuli, Shubh Khanna, Anna Goldie, and Christopher D. Manning. Raptor: Recursive abstractive processing for tree-organized retrieval. In The Twelfth International Conference on Learning Representations.
- Yilin Xiao, Junnan Dong, Chuang Zhou, Su Dong, Qian-wen Zhang, Di Yin, Xing Sun, and Xiao Huang. 2025. GraphRAG-Bench: Challenging Domain-Specific Reasoning for Evaluating Graph Retrieval-Augmented Generation. arXiv preprint arXiv:2506.02404 (2025).
- Joyce Cahoon, Prerna Singh, Nick Litombe, Jonathan Larson, Ha Trinh, Yiwen Zhu, Andreas Mueller, Fotis Psallidas, and Carlo Curino. 2025. Optimizing open-domain question answering with graph-based retrieval augmented generation. In Proceedings of the 1st workshop connecting academia and industry on Modern Integrated Database and AI Systems. 1-11.
實(shí)驗(yàn)室簡(jiǎn)介
北京大學(xué)數(shù)據(jù)與智能實(shí)驗(yàn)室(Data And Intelligence Research Lab at Peking Univeristy,PKU-DAIR實(shí)驗(yàn)室)由北京大學(xué)計(jì)算機(jī)學(xué)院崔斌教授領(lǐng)導(dǎo),長(zhǎng)期從事數(shù)據(jù)庫(kù)系統(tǒng)、大數(shù)據(jù)管理與分析、人工智能等領(lǐng)域的前沿研究,在理論和技術(shù)創(chuàng)新以及系統(tǒng)研發(fā)上取得多項(xiàng)成果,已在國(guó)際頂級(jí)學(xué)術(shù)會(huì)議和期刊發(fā)表學(xué)術(shù)論文200余篇,發(fā)布多個(gè)開(kāi)源項(xiàng)目。課題組同學(xué)曾數(shù)十次獲得包括CCF優(yōu)博、ACM中國(guó)優(yōu)博、北大優(yōu)博、微軟學(xué)者、蘋(píng)果獎(jiǎng)學(xué)金、谷歌獎(jiǎng)學(xué)金等榮譽(yù)。PKU-DAIR實(shí)驗(yàn)室持續(xù)與工業(yè)界展開(kāi)卓有成效的合作,與騰訊、阿里巴巴、蘋(píng)果、微軟、百度、快手、中興通訊等多家知名企業(yè)開(kāi)展項(xiàng)目合作和前沿探索,解決實(shí)際問(wèn)題,進(jìn)行科研成果的轉(zhuǎn)化落地。

評(píng)論 0