偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

GraphRAG優(yōu)化新思路-開(kāi)源的ROGRAG框架

發(fā)布于 2025-6-6 09:37
瀏覽
0收藏

目前的如微軟開(kāi)源的GraphRAG的工作流程都較為復(fù)雜,難以孤立地評(píng)估各個(gè)組件的貢獻(xiàn),傳統(tǒng)的檢索方法在處理復(fù)雜推理任務(wù)時(shí)可能不夠有效,特別是在需要理解實(shí)體間關(guān)系或多跳知識(shí)的情況下。先說(shuō)結(jié)論,看完后感覺(jué)這個(gè)框架性能上不會(huì)比GraphRAG高,僅在單一數(shù)據(jù)集上進(jìn)行了評(píng)測(cè),不過(guò)優(yōu)化思路可以借鑒下,比如:雙層次檢索提高圖檢索準(zhǔn)確性等。供參考。

方法

GraphRAG優(yōu)化新思路-開(kāi)源的ROGRAG框架-AI.x社區(qū)

整體流程

圖構(gòu)建及索引

GraphRAG優(yōu)化新思路-開(kāi)源的ROGRAG框架-AI.x社區(qū)

這一步主要是使用LLM構(gòu)建知識(shí)圖譜(KG),涉及預(yù)處理(多源異構(gòu)內(nèi)容轉(zhuǎn)text)、文本chunk分割、KG構(gòu)建(命名實(shí)體識(shí)別(NER)、分割的文本中提取<實(shí)體, 關(guān)系, 實(shí)體>三元組,以及相關(guān)的關(guān)鍵詞、描述和權(quán)重。這些三元組用于構(gòu)建圖,捕捉語(yǔ)料中的復(fù)雜多跳依賴關(guān)系)、圖存儲(chǔ)。

圖引導(dǎo)檢索

這一步是ROGRAG的核心,分為兩種主要方法:雙層次方法和邏輯形式方法。

1、雙層次方法

GraphRAG優(yōu)化新思路-開(kāi)源的ROGRAG框架-AI.x社區(qū)

query被分解為兩個(gè)組成部分:(1)表示實(shí)體的低層關(guān)鍵詞和(2)高層關(guān)系描述。通過(guò)模糊匹配將實(shí)體與圖中的節(jié)點(diǎn)匹配,關(guān)系關(guān)鍵詞與邊匹配。檢索結(jié)果合并后,去除冗余的邊、節(jié)點(diǎn)和塊引用,精煉最終的檢索上下文。優(yōu)勢(shì)是這種方法利用多粒度特征進(jìn)行分層模糊匹配,提高了對(duì)不規(guī)范或復(fù)雜查詢的檢索覆蓋率。

2、邏輯形式方法

使用預(yù)定義的操作符(如過(guò)濾、聚合)將自然語(yǔ)言查詢轉(zhuǎn)化為結(jié)構(gòu)化的檢索操作序列。利用LLM將自然語(yǔ)言查詢轉(zhuǎn)化為結(jié)構(gòu)化的檢索操作序列,并通過(guò)迭代優(yōu)化來(lái)增強(qiáng)檢索上下文。這種方法提供了更精確的檢索結(jié)果,特別適用于需要結(jié)構(gòu)化推理的任務(wù)。

GraphRAG優(yōu)化新思路-開(kāi)源的ROGRAG框架-AI.x社區(qū)

邏輯形式方法算法過(guò)程:通過(guò)LLM將復(fù)雜的自然語(yǔ)言查詢分解為一系列簡(jiǎn)單的子查詢,然后使用預(yù)定義的操作符對(duì)這些子查詢進(jìn)行處理,最終得到結(jié)構(gòu)化的檢索操作序列。

圖增強(qiáng)生成

這里和其他rag方法一致,主要優(yōu)化輸出。

實(shí)驗(yàn)性能

整體結(jié)果

GraphRAG優(yōu)化新思路-開(kāi)源的ROGRAG框架-AI.x社區(qū)

GraphRAG優(yōu)化新思路-開(kāi)源的ROGRAG框架-AI.x社區(qū)

參考文獻(xiàn):

  • paper:ROGRAG: A Robustly Optimized GraphRAG Framework,https://arxiv.org/abs/2503.06474
  • code:https://github.com/tpoisonooo/ROGRAG

?

本文轉(zhuǎn)載自??大模型自然語(yǔ)言處理???   作者:余俊暉


收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦