偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破 原創(chuàng) 精華

發(fā)布于 2025-2-20 14:28
瀏覽
0收藏

摘要

盡管檢索增強(qiáng)生成(RAG)系統(tǒng)通過外部檢索擴(kuò)展了大語言模型(LLM)的能力,并取得了一定進(jìn)展,但這些系統(tǒng)在應(yīng)對(duì)復(fù)雜多變的工業(yè)應(yīng)用需求時(shí)仍顯不足。特別是在提取深度領(lǐng)域知識(shí)和進(jìn)行邏輯推理方面,僅依賴檢索的方式存在明顯短板。為此,微軟推出了PIKE-RAG(sPecIalized KnowledgE and Rationale Augmentation Generation),旨在通過提取、理解和應(yīng)用專業(yè)知識(shí),構(gòu)建連貫的推理鏈條,逐步引導(dǎo)LLM生成更精準(zhǔn)的響應(yīng)。github對(duì)應(yīng)的地址如下: https://github.com/microsoft/PIKE-RAG

背景

當(dāng)前的RAG方法主要依賴文本檢索和LLM的理解能力,缺乏對(duì)多樣化數(shù)據(jù)源的深度利用。在工業(yè)應(yīng)用中,尤其是涉及專業(yè)知識(shí)和復(fù)雜邏輯的場(chǎng)景中,現(xiàn)有的RAG方法表現(xiàn)出明顯的局限性。以下是RAG在工業(yè)應(yīng)用中面臨的主要挑戰(zhàn):

  1. 知識(shí)來源多樣性:RAG系統(tǒng)依賴于多領(lǐng)域、多格式的文檔語料庫,包括掃描圖像、數(shù)字文本和網(wǎng)絡(luò)數(shù)據(jù)等,處理這些多樣化數(shù)據(jù)源的能力有限。
  2. 領(lǐng)域?qū)I(yè)化不足:工業(yè)應(yīng)用需要RAG系統(tǒng)具備特定領(lǐng)域的專業(yè)知識(shí)和邏輯推理能力,但現(xiàn)有的RAG方法在提取和理解領(lǐng)域特定知識(shí)方面表現(xiàn)不佳。例如,在半導(dǎo)體設(shè)計(jì)領(lǐng)域,LLM難以準(zhǔn)確捕捉關(guān)鍵的物理原理。
  3. 一刀切的問題:不同應(yīng)用場(chǎng)景對(duì)RAG系統(tǒng)的能力要求各異,現(xiàn)有方法往往采用通用策略,無法滿足特定場(chǎng)景的復(fù)雜需求。例如,在基于規(guī)則的查詢和多跳查詢場(chǎng)景中,RAG系統(tǒng)需要不同的能力來應(yīng)對(duì)不同的挑戰(zhàn)。

架構(gòu)

PIKE-RAG框架主要由幾個(gè)基本模塊組成,包括文檔解析、知識(shí)提取、知識(shí)存儲(chǔ)、知識(shí)檢索、知識(shí)組織、以知識(shí)為中心的推理以及任務(wù)分解與協(xié)調(diào)。通過調(diào)整主模塊中的子模塊,可以實(shí)現(xiàn)專注于不同能力的RAG系統(tǒng),以滿足現(xiàn)實(shí)場(chǎng)景中的多樣化需求。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)

Overview of PIKE-RAG Framework

問題分類

面對(duì)RAG系統(tǒng)在工業(yè)應(yīng)用中的挑戰(zhàn),微軟提出了PIKE-RAG,通過提取、理解和應(yīng)用專業(yè)知識(shí),結(jié)合特定任務(wù)的推理邏輯,顯著提升了RAG系統(tǒng)的能力。PIKE-RAG將問題分為四類:事實(shí)性問題可鏈接推理問題、預(yù)測(cè)性問題創(chuàng)造性問題,并據(jù)此提出了RAG系統(tǒng)的能力分類,為系統(tǒng)優(yōu)化指明了方向。

  1. 事實(shí)性問題:直接從語料庫中提取明確信息,依賴檢索機(jī)制識(shí)別相關(guān)事實(shí)。
  2. 可鏈接推理問題:需要多步推理和跨來源的知識(shí)整合,解決復(fù)雜邏輯鏈條。
  3. 預(yù)測(cè)性問題:通過歸納推理,將數(shù)據(jù)組織成可分析的形式(如時(shí)間序列),進(jìn)行未來趨勢(shì)預(yù)測(cè)。
  4. 創(chuàng)造性問題:結(jié)合領(lǐng)域邏輯和創(chuàng)造性思維,生成創(chuàng)新解決方案。

這種分類方法不僅覆蓋了工業(yè)領(lǐng)域的多樣化需求,還確保了RAG系統(tǒng)能夠高效應(yīng)對(duì)從簡(jiǎn)單檢索到復(fù)雜推理的全方位挑戰(zhàn)。PIKE-RAG的推出,標(biāo)志著RAG系統(tǒng)在專業(yè)領(lǐng)域的應(yīng)用邁出了重要一步。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)


知識(shí)庫

盡管當(dāng)前研究主要側(cè)重于通過算法增強(qiáng)提高檢索增強(qiáng)生成(RAG)系統(tǒng)的性能,但對(duì)RAG框架的全面評(píng)估仍較少。在此,我們以知識(shí)庫、任務(wù)分類和系統(tǒng)開發(fā)三個(gè)關(guān)鍵視角概括RAG框架。我們認(rèn)為知識(shí)庫是RAG的核心,貫穿檢索和生成過程。并且,RAG任務(wù)的復(fù)雜性和難度可能會(huì)根據(jù)所需的生成能力和可用支持文本有顯著差異。因此,我們根據(jù)RAG系統(tǒng)解決不同問題的能力將其劃分為不同層次。

在實(shí)際應(yīng)用中,特定領(lǐng)域(如制造業(yè)、能源和物流)的專業(yè)知識(shí)主要來自多年積累的數(shù)據(jù),例如藥品行業(yè)的大量研發(fā)文檔和藥物申請(qǐng)文件。這些資料包含多種格式和多模態(tài)內(nèi)容,如表格、圖表和圖片,它們間還存在功能性鏈接,反映了領(lǐng)域能知識(shí)的邏輯組織。然而,現(xiàn)有數(shù)據(jù)集通常只提供預(yù)分割的語料庫,未涵蓋現(xiàn)實(shí)應(yīng)用復(fù)雜性,比如整合多格式數(shù)據(jù)和維護(hù)文檔間引用關(guān)系。

因此,建立全面的知識(shí)庫成為工業(yè)RAG應(yīng)用的重要基礎(chǔ)。我們建議構(gòu)建一個(gè)多層異構(gòu)圖形知識(shí)庫,其節(jié)點(diǎn)和邊代表不同元素(如文檔、章節(jié)、段落、圖表等)及其關(guān)系。這個(gè)圖由信息資源層、語料層和提煉知識(shí)層組成,每一層對(duì)應(yīng)信息處理的不同階段,象征著不同的知識(shí)粒度和抽象層次。

詳細(xì)設(shè)計(jì)

L0 知識(shí)庫構(gòu)建

所提出的RAG系統(tǒng)的基礎(chǔ)階段被指定為L0系統(tǒng),其重點(diǎn)在于構(gòu)建一個(gè)強(qiáng)大且全面的知識(shí)庫。這一階段對(duì)于在后續(xù)層級(jí)中實(shí)現(xiàn)有效的知識(shí)檢索至關(guān)重要。L0系統(tǒng)的主要目標(biāo)是處理和結(jié)構(gòu)化領(lǐng)域特定文檔,將其轉(zhuǎn)換為機(jī)器可讀的格式,并將提取的知識(shí)組織成一個(gè)異構(gòu)圖。該圖作為所有高級(jí)推理和檢索任務(wù)的基礎(chǔ)。L0系統(tǒng)包含幾個(gè)關(guān)鍵模塊:文件解析、知識(shí)提取和知識(shí)存儲(chǔ)。每個(gè)模塊在確保知識(shí)庫既廣泛又準(zhǔn)確反映源文檔中包含的底層信息方面發(fā)揮著至關(guān)重要的作用。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)

文檔解析

文件解析模塊負(fù)責(zé)處理各種類型的文件,這包括處理掃描文檔、圖像和復(fù)雜的表格等。為了保留多模態(tài)元素,框架采用布局分析技術(shù),并使用視覺語言模型來描述圖表內(nèi)容,以確保信息的完整性。

知識(shí)組織

知識(shí)庫被構(gòu)建為一個(gè)多層異質(zhì)圖,表示不同層次的信息粒度和抽象級(jí)別。該圖捕捉了數(shù)據(jù)各個(gè)組成部分(例如文檔、章節(jié)、塊、圖表和表格)之間的關(guān)系,并將它們組織成節(jié)點(diǎn)和邊,以反映它們的相互聯(lián)系和依賴關(guān)系。如下圖所示,這種多層結(jié)構(gòu)包括信息資源層、語料庫層和提煉知識(shí)層,能夠?yàn)橄掠稳蝿?wù)提供語義理解和基于推理的檢索能力。

信息資源層:該層捕捉多樣化的信息源,將其視為源節(jié)點(diǎn),并通過邊表示它們之間的引用關(guān)系。這種結(jié)構(gòu)有助于交叉引用和知識(shí)的情境化,為依賴于多源信息的推理奠定了基礎(chǔ)。

語料庫層:該層將解析后的信息組織成章節(jié)和塊,同時(shí)保留文檔的原始層次結(jié)構(gòu)。表格和圖表等多模態(tài)內(nèi)容由大語言模型(LLMs)進(jìn)行總結(jié),并作為塊節(jié)點(diǎn)集成,確保多模態(tài)知識(shí)可用于檢索。該層支持不同粒度的知識(shí)提取,能夠?qū)崿F(xiàn)跨多種內(nèi)容類型的精確語義分塊和檢索。

提煉知識(shí)層:語料庫進(jìn)一步被提煉為結(jié)構(gòu)化的知識(shí)形式(例如知識(shí)圖譜、原子知識(shí)和表格知識(shí))。這一過程通過命名實(shí)體識(shí)別(NER)和關(guān)系提取等技術(shù)驅(qū)動(dòng),確保提煉的知識(shí)捕捉關(guān)鍵邏輯關(guān)系和實(shí)體,從而支持高級(jí)推理過程。通過將這種結(jié)構(gòu)化知識(shí)組織在提煉層中,我們?cè)鰪?qiáng)了系統(tǒng)基于更深層次領(lǐng)域知識(shí)進(jìn)行推理和綜合的能力。知識(shí)提煉過程如下圖所示。以下是典型知識(shí)形式的詳細(xì)提煉過程。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)


L1: 事實(shí)性問題回答

在L0系統(tǒng)的基礎(chǔ)上,L1系統(tǒng)引入了知識(shí)檢索和知識(shí)組織,以實(shí)現(xiàn)其檢索和生成能力。這一級(jí)別的主要挑戰(zhàn)是語義對(duì)齊和分塊。大量的專業(yè)術(shù)語和別名可能會(huì)影響分塊檢索的準(zhǔn)確性,而不合理的分塊可能會(huì)破壞語義連貫性并引入噪聲干擾。為了緩解這些問題,L1系統(tǒng)采用了更復(fù)雜的查詢分析技術(shù)和基本知識(shí)提取模塊。其架構(gòu)擴(kuò)展為包含支持任務(wù)分解、協(xié)調(diào)以及知識(shí)組織(KO)初始階段的組件,確保系統(tǒng)能夠有效處理更復(fù)雜的查詢。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)


增強(qiáng)分塊

在RAG系統(tǒng)中,分塊(Chunking)是將大量文本分解為更小、更易管理的片段的過程。常見的分塊策略包括固定大小分塊語義分塊混合分塊。分塊不僅影響檢索的效率和準(zhǔn)確性,還直接決定了RAG模型的整體表現(xiàn)。

在我們的系統(tǒng)中,每個(gè)分塊扮演雙重角色:

  1. 信息單元:被向量化并存儲(chǔ)在數(shù)據(jù)庫中,供檢索使用。
  2. 知識(shí)源:作為進(jìn)一步知識(shí)提取和信息總結(jié)的基礎(chǔ)。

不恰當(dāng)?shù)姆謮K會(huì)導(dǎo)致文本向量缺失關(guān)鍵語義信息,甚至阻礙基于完整上下文的知識(shí)提取。為了解決這一問題,我們提出了一種文本分割算法,旨在通過保留上下文并為每個(gè)塊生成有效摘要,提升分塊效果。

算法核心:動(dòng)態(tài)分塊與摘要生成
  1. 迭代分割:算法將文本逐步分割成塊,每次迭代生成初始?jí)K的前向摘要,為后續(xù)塊的摘要生成提供上下文支持。
  2. 摘要生成:每個(gè)塊使用預(yù)定義的提示模板進(jìn)行總結(jié),結(jié)合前向摘要和當(dāng)前塊內(nèi)容,確保敘述連貫。
  3. 動(dòng)態(tài)調(diào)整:算法根據(jù)文本內(nèi)容和結(jié)構(gòu)動(dòng)態(tài)調(diào)整塊大小,確保分塊效果最優(yōu)。

通過這一算法,RAG系統(tǒng)能夠更高效地處理復(fù)雜文本,為后續(xù)的知識(shí)提取和推理奠定堅(jiān)實(shí)基礎(chǔ)。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)


自動(dòng)標(biāo)注

在RAG的特定領(lǐng)域應(yīng)用中,如醫(yī)療問答,我們常面臨語言風(fēng)格差異挑戰(zhàn),即問題通常以口語化表述,而語料庫則采用專業(yè)術(shù)語。這可能影響檢索的準(zhǔn)確性。為解決這一問題,我們?cè)O(shè)計(jì)了一個(gè)自動(dòng)標(biāo)記模塊,能有效縮小查詢和源文檔間的差距。

該模塊通過預(yù)處理語料庫,提取全面的領(lǐng)域特定標(biāo)簽或制定標(biāo)簽映射規(guī)則。在檢索前,我們從查詢中提取標(biāo)簽,并利用已生成的標(biāo)簽集合或標(biāo)簽對(duì)集將其映射到語料庫領(lǐng)域,以提高召回率和精確率。

具體來說,我們利用大語言模型(LLMs)識(shí)別語料庫塊中的關(guān)鍵信息,總結(jié)并歸類為“標(biāo)簽類”。我們?nèi)缓笊烧Z義標(biāo)簽提取提示,以便更精準(zhǔn)地提取標(biāo)簽。當(dāng)只有語料庫可用時(shí),我們使用這些提示讓LLMs從語料庫中提取標(biāo)簽。有問答樣本可用時(shí),我們同時(shí)對(duì)查詢和相應(yīng)的檢索答案塊進(jìn)行標(biāo)簽提取。利用這些提取的標(biāo)簽,LLMs可以映射跨領(lǐng)域標(biāo)簽并生成標(biāo)簽對(duì)集合。

在建立好語料庫的標(biāo)簽集合和標(biāo)簽對(duì)集后,可以從查詢中提取標(biāo)簽并在集合中識(shí)別相應(yīng)的映射標(biāo)簽。這些映射標(biāo)簽隨后用于增強(qiáng)信息檢索過程,提升召回率和精確率。這一流程利用了LLMs的高級(jí)理解和上下文能力以實(shí)現(xiàn)領(lǐng)域適應(yīng)性。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)


多粒度檢索

L1系統(tǒng)是構(gòu)建在L0系統(tǒng)之上的,旨在實(shí)現(xiàn)跨異質(zhì)知識(shí)圖的多層次、多粒度檢索。這個(gè)知識(shí)圖的每一層(如信息源層、語料庫層、提煉知識(shí)層)代表了不同抽象層次和粒度的知識(shí),使我們能從多個(gè)角度探索和獲取信息。

查詢可以映射到整個(gè)文檔或特定文本塊,以在正確的層次上找到所需知識(shí)。為實(shí)現(xiàn)此功能,系統(tǒng)會(huì)計(jì)算查詢與圖節(jié)點(diǎn)的相似度分?jǐn)?shù),度量檢索知識(shí)的準(zhǔn)確性。這些分?jǐn)?shù)經(jīng)過各層傳播,聚合不同層次的信息。這種多層傳播允許我們根據(jù)全局和局部視角調(diào)整檢索結(jié)果。最終的相似度分?jǐn)?shù)由聚合和傳播的組合得出,以平衡精確性和效率。

此外,檢索過程可進(jìn)行迭代優(yōu)化,基于任務(wù)分解產(chǎn)生的子查詢可進(jìn)一步提升生成答案的準(zhǔn)確性和相關(guān)性。

我們以下圖為例來詳細(xì)說明:對(duì)于圖的每一層,查詢Q和圖節(jié)點(diǎn)都被轉(zhuǎn)換為高維向量嵌入以評(píng)估相似度。這個(gè)過程被表示為g(?),其中I、C和D分別代表信息源層、語料庫層和提煉知識(shí)層的節(jié)點(diǎn)集。傳播和聚合操作則由函數(shù)f(?)表示,最終的塊相似度分?jǐn)?shù)S則通過聚合其他層和節(jié)點(diǎn)的分?jǐn)?shù)得到。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)


L2: 可鏈接推理問題回答

L2系統(tǒng)的核心功能在于其能夠高效檢索多個(gè)相關(guān)信息源并基于此進(jìn)行復(fù)雜推理。為實(shí)現(xiàn)這一目標(biāo),L2系統(tǒng)集成了一個(gè)先進(jìn)的知識(shí)提取模塊,全面識(shí)別并提取相關(guān)信息。此外,系統(tǒng)還實(shí)現(xiàn)了任務(wù)分解與協(xié)調(diào)模塊,將復(fù)雜任務(wù)分解為更小、更易管理的子任務(wù),從而提升系統(tǒng)處理任務(wù)的效率。

分塊文本包含多方面的信息,增加了檢索的復(fù)雜性。最近的研究集中于從分塊文本中提取三元組知識(shí)單元并構(gòu)建知識(shí)圖譜,以促進(jìn)高效的信息檢索。然而,知識(shí)圖譜的構(gòu)建成本較高,且其內(nèi)在知識(shí)可能無法被完全挖掘。為了更好地呈現(xiàn)文檔中嵌入的知識(shí),我們?cè)谥R(shí)提取階段提出將原始文檔原子化,這一過程我們稱為知識(shí)原子化。此外,工業(yè)任務(wù)通常需要多段知識(shí),這隱含了對(duì)原始問題進(jìn)行分解為多個(gè)順序或并行原子問題的能力需求。我們將此操作稱為任務(wù)分解。通過將提取的原子知識(shí)與原始分塊結(jié)合,我們構(gòu)建了一個(gè)原子化層次知識(shí)庫。每次分解任務(wù)時(shí),層次知識(shí)庫都會(huì)提供可用知識(shí)的洞察,從而實(shí)現(xiàn)知識(shí)感知的任務(wù)分解。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)

知識(shí)原子化

我們認(rèn)為,單個(gè)文檔塊通常包含多段知識(shí)。通常情況下,解決特定任務(wù)所需的信息僅代表整個(gè)知識(shí)的一個(gè)子集。因此,像傳統(tǒng)信息檢索那樣將這些知識(shí)片段整合在單個(gè)塊中,可能無法促進(jìn)所需精確信息的高效檢索。為了使知識(shí)的粒度與任務(wù)解決過程中生成的查詢相匹配,我們提出了一種稱為知識(shí)原子化的方法。該方法利用大語言模型(LLMs)的上下文理解和內(nèi)容生成能力,自動(dòng)為每個(gè)文檔塊中的原子知識(shí)片段打上標(biāo)簽。需要注意的是,這些塊可以是原始參考文檔的片段、為表格、圖像、視頻生成的描述塊,甚至是整個(gè)章節(jié)或文檔的總結(jié)塊。

原子知識(shí)的呈現(xiàn)方式可以多種多樣。我們建議使用問題作為知識(shí)索引,而不是使用陳述句或主語-關(guān)系-賓語三元組,以進(jìn)一步縮小存儲(chǔ)知識(shí)與查詢之間的差距。與語義標(biāo)記過程不同,在知識(shí)原子化過程中,我們將文檔塊作為上下文輸入給LLM,要求其生成盡可能多的可以由給定塊回答的相關(guān)問題。這些生成的原子問題與給定塊一起保存為原子問題標(biāo)簽。

知識(shí)感知的任務(wù)分解

任務(wù)分解模塊將復(fù)雜任務(wù)分解為更小的子任務(wù),以提高系統(tǒng)的處理效率。通過生成和評(píng)估原子問題提案,動(dòng)態(tài)調(diào)整檢索和推理過程。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)


知識(shí)感知任務(wù)分解器的訓(xùn)練

通過收集和訓(xùn)練數(shù)據(jù),使任務(wù)分解器能夠更好地理解和處理領(lǐng)域特定的知識(shí)。通過強(qiáng)化學(xué)習(xí)等方法,優(yōu)化任務(wù)分解和結(jié)果尋找過程。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)


L3: 預(yù)測(cè)性問題回答

L3 專注于處理預(yù)測(cè)性問題,強(qiáng)調(diào)基于知識(shí)的預(yù)測(cè)能力。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)

在L3系統(tǒng)中,更加注重基于知識(shí)的預(yù)測(cè)能力,這需要有效的知識(shí)收集、組織以及構(gòu)建預(yù)測(cè)邏輯。為此,我們利用任務(wù)分解與協(xié)調(diào)模塊,基于從檢索知識(shí)中收集和組織的有序知識(shí),構(gòu)建預(yù)測(cè)邏輯。L3系統(tǒng)的框架如上圖所示。為了確保檢索到的知識(shí)能夠?yàn)楦呒?jí)分析和預(yù)測(cè)做好準(zhǔn)備,知識(shí)組織模塊增強(qiáng)了專門用于知識(shí)結(jié)構(gòu)化和組織的子模塊。這些子模塊簡(jiǎn)化了將原始檢索知識(shí)轉(zhuǎn)化為結(jié)構(gòu)化、連貫格式的過程,從而優(yōu)化后續(xù)推理和預(yù)測(cè)任務(wù)。

鑒于大語言模型(LLMs)在應(yīng)用專業(yè)推理邏輯方面的局限性,其在預(yù)測(cè)任務(wù)中的有效性可能受到限制。為了克服這一問題,知識(shí)中心推理模塊增強(qiáng)了預(yù)測(cè)子模塊,使系統(tǒng)能夠基于輸入查詢和組織知識(shí)推斷結(jié)果。這一預(yù)測(cè)子模塊使系統(tǒng)不僅能夠基于歷史知識(shí)生成答案,還能進(jìn)行預(yù)測(cè),從而為復(fù)雜查詢提供更強(qiáng)大和動(dòng)態(tài)的響應(yīng)。通過整合先進(jìn)的知識(shí)結(jié)構(gòu)化和預(yù)測(cè)能力,L3系統(tǒng)能夠有效管理和利用更復(fù)雜和動(dòng)態(tài)的知識(shí)庫。

L4: 創(chuàng)造性問題回答

L4 系統(tǒng)的實(shí)現(xiàn)特點(diǎn)在于集成了多智能體系統(tǒng),以促進(jìn)多角度思考。解決創(chuàng)造性問題需要基于事實(shí)信息并理解基本原理和規(guī)則的創(chuàng)造性思維。在這個(gè)高級(jí)階段,主要挑戰(zhàn)包括從檢索到的知識(shí)中提取連貫的邏輯推理、在眾多影響因素中導(dǎo)航復(fù)雜的推理過程,以及評(píng)估對(duì)創(chuàng)造性、開放性問題的回答質(zhì)量。為了應(yīng)對(duì)這些挑戰(zhàn),系統(tǒng)協(xié)調(diào)多個(gè)智能體,每個(gè)智能體都貢獻(xiàn)獨(dú)特的見解和推理策略,如下所示。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)


這些智能體并行運(yùn)作,綜合各種思維過程,生成全面且連貫的解決方案。這種多智能體架構(gòu)支持并行處理和整合不同的推理路徑,確保有效管理和應(yīng)對(duì)復(fù)雜查詢。通過模擬多樣化的觀點(diǎn),L4 系統(tǒng)增強(qiáng)了處理創(chuàng)造性問題的能力,生成創(chuàng)新性想法而非預(yù)定義的解決方案。多個(gè)智能體的協(xié)調(diào)輸出不僅豐富了推理過程,還為用戶提供了全面的視角,促進(jìn)創(chuàng)造性思維,并激發(fā)解決復(fù)雜問題的新穎方案。

測(cè)試結(jié)果

為了驗(yàn)證我們提出方法的有效性,PIKE-RAG在開放域基準(zhǔn)測(cè)試和特定領(lǐng)域基準(zhǔn)測(cè)試上進(jìn)行了實(shí)驗(yàn)。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破-AI.x社區(qū)



本文轉(zhuǎn)載自公眾號(hào)AI 博物院 作者:longyunfeigu

原文鏈接:??https://mp.weixin.qq.com/s/_WRlXG4-3KhyrnlMBnPs_Q??

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦