偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

從傳統(tǒng) RAG 到圖 RAG,賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量

發(fā)布于 2024-10-25 14:09
瀏覽
0收藏

大型語(yǔ)言模型 (LLMs) 在固定數(shù)據(jù)集上進(jìn)行訓(xùn)練,其知識(shí)在最后一次訓(xùn)練更新時(shí)就已固定。

ChatGPT 的常規(guī)用戶可能已經(jīng)注意到其眾所周知的局限性:“訓(xùn)練數(shù)據(jù)截止到 2021 年 9 月”。

這種局限性會(huì)導(dǎo)致模型產(chǎn)生不準(zhǔn)確或過(guò)時(shí)的響應(yīng),因?yàn)樗鼈儠?huì)“幻覺(jué)”信息。

在不重新訓(xùn)練或微調(diào)的情況下,用新信息更新模型或增強(qiáng)其上下文理解能力,在資源和人力方面都極具挑戰(zhàn)。

檢索增強(qiáng)生成 (RAG)

檢索增強(qiáng)生成 (簡(jiǎn)稱 RAG) 是一種通過(guò)整合來(lái)自外部可靠知識(shí)庫(kù)的信息來(lái)改進(jìn)大型語(yǔ)言模型 (LLMs) 的技術(shù)。

RAG 背后的原理很簡(jiǎn)單:當(dāng) LLM 被問(wèn)到一個(gè)問(wèn)題時(shí),它不會(huì)僅僅依賴于自己已有的知識(shí)。

相反,它會(huì)首先從指定的知識(shí)源中查找相關(guān)信息。

這種方法確保了生成的輸出引用了大量語(yǔ)境豐富的數(shù)據(jù),并通過(guò)最新的相關(guān)信息進(jìn)行增強(qiáng)。

RAG 主要通過(guò)兩個(gè)階段的流程來(lái)運(yùn)作:檢索內(nèi)容生成

檢索階段

在檢索階段,算法會(huì)定位并收集與用戶提示或查詢相關(guān)的相關(guān)信息片段。

例如,如果你想搜索福建面食的食譜,你的提示可能是“_福建面食的配料是什么?_”

系統(tǒng)會(huì)識(shí)別出與查詢語(yǔ)義相關(guān)的文檔,并使用相似度度量來(lái)計(jì)算其相關(guān)性,通常使用余弦相似度( Is Cosine-Similarity of Embeddings Really About Similarity?) 來(lái)進(jìn)行計(jì)算。

在收集外部知識(shí)后,它會(huì)將其附加到用戶的提示中,并將其作為增強(qiáng)后的輸入發(fā)送到語(yǔ)言模型。

內(nèi)容生成階段

在隨后的生成階段,LLM 將此增強(qiáng)后的提示與其自身的訓(xùn)練數(shù)據(jù)表示相結(jié)合,以生成一個(gè)針對(duì)用戶查詢的定制化響應(yīng)。

該響應(yīng)提供了一種個(gè)性化和可驗(yàn)證信息,適合通過(guò)聊天機(jī)器人等應(yīng)用程序使用。

從傳統(tǒng) RAG 到圖 RAG,賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

檢索增強(qiáng)生成

RAG 的重要性

在當(dāng)今的技術(shù)領(lǐng)域,LLMs 驅(qū)動(dòng)著 眾多 自然 語(yǔ)言 應(yīng)用程序 ,能夠理解或生成類似人類的文本。

雖然這些模型功能強(qiáng)大,但有時(shí)也會(huì)出現(xiàn)不足。

有時(shí),它們?cè)谏刹徽_的響應(yīng)時(shí)會(huì)過(guò)于自信,以至于人們很容易被它們極具說(shuō)服力的論據(jù)所影響。

RAG 試圖通過(guò)引導(dǎo) LLM 從可信來(lái)源獲取信息來(lái)緩解這些問(wèn)題,從而保持模型輸出的相關(guān)性和準(zhǔn)確性。

RAG 的局限性

就像生活中的所有事物一樣,傳統(tǒng)的 RAG 方法也有其復(fù)雜性和挑戰(zhàn)。

雖然 RAG 在增強(qiáng) LLMs 的功能方面具有開創(chuàng)性,但它也存在一些局限性,這些局限性會(huì)影響其有效性和適用性。

其中一個(gè)主要挑戰(zhàn)涉及檢索信息的準(zhǔn)確性和數(shù)據(jù)源異質(zhì)性。

為了使 RAG 有效,它通常依賴于多個(gè)外部來(lái)源,這些來(lái)源可能具有不同的格式、標(biāo)準(zhǔn)和可靠性級(jí)別。(例如 PDF、平面文件、Markdown、CSV、Web 內(nèi)容等)

RAG 實(shí)現(xiàn)也遇到了一些困難,例如處理含糊的查詢或需要深入理解上下文的查詢。

這些問(wèn)題是技術(shù)設(shè)計(jì)固有的問(wèn)題,主要源于檢索過(guò)程,檢索過(guò)程有時(shí)會(huì)忽略產(chǎn)生精確響應(yīng)所需的細(xì)微差別。

從傳統(tǒng) RAG 到圖 RAG,賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

上下文很重要,一個(gè)恰當(dāng)?shù)亩禾?hào)也是如此

RAG 的改進(jìn)

提高 RAG 系統(tǒng)的檢索準(zhǔn)確率和效率是自然語(yǔ)言處理和機(jī)器學(xué)習(xí)領(lǐng)域持續(xù)進(jìn)行的研究方向。

為了實(shí)現(xiàn)這些改進(jìn),可以采取多種策略,但我想要重點(diǎn)介紹兩種在當(dāng)今技術(shù)條件下可以實(shí)現(xiàn)的顯著改進(jìn)。

  1. 實(shí)施更復(fù)雜的檢索算法,能夠更好地理解查詢的語(yǔ)義,可以提高檢索到的文檔的相關(guān)性。
  2. 有效地索引知識(shí)庫(kù),以加快檢索過(guò)程,而不犧牲結(jié)果的質(zhì)量。

這將我們引向…

圖 RAG:RAG x 知識(shí)圖譜

圖 RAG 在 RAG 的概念基礎(chǔ)上,利用了知識(shí)圖譜 (KGs)。

這種創(chuàng)新方法是由 NebulaGraph 首創(chuàng)的概念,它通過(guò)整合圖數(shù)據(jù)庫(kù),改變了 LLMs 解釋和響應(yīng)查詢的方式。

圖 RAG 通過(guò)將 KGs 中的結(jié)構(gòu)化數(shù)據(jù)整合到 LLM 的處理中,為模型的響應(yīng)提供了更細(xì)致入微和信息豐富的基礎(chǔ)。

KGs 是對(duì)現(xiàn)實(shí)世界實(shí)體及其關(guān)系的結(jié)構(gòu)化表示。

它們包含兩個(gè)主要部分:_節(jié)點(diǎn)_和_邊_。

節(jié)點(diǎn)代表單個(gè)實(shí)體,例如_人物_、_地點(diǎn)_、_物體_或_概念_。

另一方面,邊代表這些節(jié)點(diǎn)之間的關(guān)系,表明它們是如何相互連接的。

從傳統(tǒng) RAG 到圖 RAG,賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

一個(gè)簡(jiǎn)單的知識(shí)圖譜

這種結(jié)構(gòu)極大地提高了 LLMs 生成有見(jiàn)地的響應(yīng)的能力,因?yàn)樗鼓P湍軌蛟L問(wèn)精確且與上下文相關(guān)的數(shù)據(jù)。

圖 RAG 的創(chuàng)新之處在于它將圖數(shù)據(jù)庫(kù)與 LLMs 整合,以在生成響應(yīng)之前豐富模型的上下文。

一些流行的圖數(shù)據(jù)庫(kù)產(chǎn)品包括 Ontotext, NebulaGraphNeo4J

圖 RAG 的重要意義

隨著 LLMs 繼續(xù)在復(fù)雜性和能力方面不斷發(fā)展,圖 RAG 有可能對(duì) AI 領(lǐng)域產(chǎn)生重大影響。

以下是我對(duì)這種整合如何演變的展望:

  1. 未來(lái) LLMs 預(yù)計(jì)將表現(xiàn)出對(duì)復(fù)雜查詢的改進(jìn)理解能力和推理能力。

圖 RAG 可以利用這些進(jìn)步來(lái)提供更精確、更富含上下文的答案。

來(lái)自知識(shí)圖譜的結(jié)構(gòu)化知識(shí),再加上更復(fù)雜的 LLMs,可能會(huì)導(dǎo)致 AI 在理解抽象概念、推理以及生成細(xì)致入微的響應(yīng)方面取得突破。

  1. 隨著 LLMs 的持續(xù)進(jìn)步,它們與知識(shí)圖譜的整合可能會(huì)變得更加動(dòng)態(tài)和無(wú)縫。

這可能包括根據(jù)全球事件或發(fā)現(xiàn)實(shí)時(shí)更新 KGs。

LLMs 可以通過(guò)將從用戶交互或其他數(shù)據(jù)源收集的新信息整合到知識(shí)圖譜中,在自動(dòng)增強(qiáng)和更新知識(shí)圖譜方面發(fā)揮作用。

使用諸如來(lái)自人類反饋的強(qiáng)化學(xué)習(xí) (RLHF) 和來(lái)自 AI 反饋的強(qiáng)化學(xué)習(xí) (RLAIF) 等技術(shù)可以進(jìn)一步幫助模型與人類偏好保持一致,并遵守 HHH (不是摔跤手,而是幫助、誠(chéng)實(shí)、無(wú)害) 原則。

  1. 隨著英偉達(dá)努力實(shí)現(xiàn) AI 計(jì)算的民主化,未來(lái) LLMs 和圖 RAG 實(shí)現(xiàn)的進(jìn)步將集中在提高計(jì)算效率和可擴(kuò)展性方面。

這種轉(zhuǎn)變將使圖 RAG 能夠應(yīng)用于更廣泛的應(yīng)用程序,包括那些需要實(shí)時(shí)響應(yīng)或在資源有限的環(huán)境中運(yùn)行的應(yīng)用程序。

  1. 未來(lái) LLMs 預(yù)計(jì)將在多個(gè)領(lǐng)域擁有更廣泛、更深入的知識(shí)。圖 RAG 可以促進(jìn)跨不同領(lǐng)域的知識(shí)轉(zhuǎn)移,這將使生成從不同領(lǐng)域獲取信息的見(jiàn)解或解決方案成為可能。

例如,應(yīng)用認(rèn)知科學(xué)的發(fā)現(xiàn)可能會(huì)導(dǎo)致開發(fā)更自然的人機(jī)交互模型,或者將網(wǎng)絡(luò)安全與心理學(xué)相結(jié)合可能會(huì)提高安全措施的有效性。

  1. 隨著圖 RAG 技術(shù)的發(fā)展,采用諸如資源描述框架 (RDF) 等知識(shí)圖譜標(biāo)準(zhǔn)可以提高各種系統(tǒng)之間的互操作性。

這可能意味著不同的實(shí)現(xiàn)可以相互交互和協(xié)作,從而推動(dòng)更廣泛的采用和創(chuàng)新。

從傳統(tǒng) RAG 到圖 RAG,賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

圖 RAG 演示

在本演示中,我們將使用 Govtech 的開發(fā)者門戶網(wǎng)站 中的產(chǎn)品信息作為我們的知識(shí)庫(kù)。

從傳統(tǒng) RAG 到圖 RAG,賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

數(shù)據(jù)集示例。我們將很快將其轉(zhuǎn)換為可用的格式。

  1. 設(shè)置

  • 使用Neo4j Desktop啟動(dòng)一個(gè) Neo4j 本地實(shí)例

從傳統(tǒng) RAG 到圖 RAG,賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

Neo4j Desktop 界面

  • 使用 LangChain 本地連接到 Neo4j 數(shù)據(jù)庫(kù)。好消息是 LangChain 有一個(gè)現(xiàn)成的模板可以輕松設(shè)置。
  1. 提取
  • 使用提示工程和 LLM 提取信息、節(jié)點(diǎn)及其連接。以下是一個(gè)提示示例:

\# 創(chuàng)建知識(shí)圖譜的說(shuō)明  
\## 概述  
您被設(shè)計(jì)用于將數(shù)據(jù)組織成知識(shí)圖譜。  
\- \*\*節(jié)點(diǎn)\*\*: 代表實(shí)體和想法。  
\- 目標(biāo)是確保知識(shí)圖譜簡(jiǎn)單易懂,便于廣泛使用。\## 節(jié)點(diǎn)標(biāo)記  
\- \*\*一致性\*\*: 對(duì)節(jié)點(diǎn)使用簡(jiǎn)單的標(biāo)簽。例如,將任何組織實(shí)體標(biāo)記為“公司”,而不是使用諸如“Facebook”或“Amazon”之類的術(shù)語(yǔ)。  
\- \*\*節(jié)點(diǎn)標(biāo)識(shí)符\*\*: 選擇文本或可理解的標(biāo)識(shí)符,而不是數(shù)字標(biāo)識(shí)符。  
  - \*\*允許的節(jié)點(diǎn)標(biāo)簽\*\*: 如果存在特定允許的節(jié)點(diǎn)標(biāo)簽,請(qǐng)?jiān)诖颂幜谐觥? 
  - \*\*允許的關(guān)系類型\*\*: 如果存在特定允許的關(guān)系類型,請(qǐng)?jiān)诖颂幜谐觥?
\## 管理數(shù)值數(shù)據(jù)和日期  
\- 將數(shù)值信息直接作為節(jié)點(diǎn)的屬性集成。  
\- \*\*集成日期/數(shù)字\*\*: 不要為日期或數(shù)字創(chuàng)建單獨(dú)的節(jié)點(diǎn),而是將它們作為屬性附加。  
\- \*\*屬性格式\*\*: 使用鍵值對(duì)格式。  
\- \*\*避免使用引號(hào)\*\*: 在屬性值中不要使用轉(zhuǎn)義引號(hào)。  
\- \*\*鍵命名\*\*: 采用 camelCase 命名鍵,例如 \`dateTime\`。

\## 一致性  
\- \*\*實(shí)體一致性\*\*: 確保跨不同提及或引用的實(shí)體一致地識(shí)別。

## 遵守指南  
嚴(yán)格遵守這些說(shuō)明是強(qiáng)制性的。不遵守將導(dǎo)致終止。
  1. 圖譜構(gòu)建
  • 使用 CSVLoader 和文檔分段來(lái)處理我們的文檔
  • 將提取的信息映射到圖節(jié)點(diǎn)和關(guān)系
  • 通過(guò)我們的提取管道處理文檔,并將信息存儲(chǔ)在 Neo4j 中

從傳統(tǒng) RAG 到圖 RAG,賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

該過(guò)程花費(fèi)了近一個(gè)小時(shí),最終產(chǎn)生了提取的節(jié)點(diǎn)標(biāo)簽列表

  • 不幸的是,并非所有節(jié)點(diǎn)標(biāo)簽都對(duì)我們的上下文有用,或者符合我們的需求。

{  
  "identity": 1040,  
  "labels": \[  
    "Feedbackstatus"  
  \],  
  "properties": {  
    "id": "Feedback-Success",  
    "message": "已發(fā)送。感謝您的反饋!”  
  },  
  "elementId": "4:81cd2613-0f18-49c1-8134-761643e88b7a:1040"  
},  
{  
  "identity": 1582,  
  "labels": \[  
    "Feedbackstatus"  
  \],  
  "properties": {  
    "id": "Feedbacksuccess",  
    "status": "已發(fā)送。感謝您的反饋!”  
  },  
  "elementId": "4:81cd2613-0f18-49c1-8134-761643e88b7a:1582"  
},  
{  
  "identity": 1405,  
  "labels": \[  
    "Header"  
  \],  
  "properties": {  
    "id": "Modalcardhead",  
    "class": "sgds-modal-card-head"  
  },  
  "elementId": "4:81cd2613-0f18-49c1-8134-761643e88b7a:1405"  
},  
{  
  "identity": 1112,  
  "labels": \[  
    "Feedbackindicator"  
  \],  
  "properties": {  
    "id": "Feedbacksuccess",  
    "title": "check",  
    "message": "已發(fā)送。感謝您的反饋!”  
  },  
  "elementId": "4:81cd2613-0f18-49c1-8134-761643e88b7a:1112"  
...
  1. 評(píng)估和細(xì)化

  • 我們將指定 LLM 應(yīng)該提取哪些節(jié)點(diǎn)標(biāo)簽來(lái)細(xì)化我們的方法

permissible\_nodes\_to\_extract = \[  
    "Aisubfield",  
    "Application",  
    "Cloudservice",  
    "Concept",  
    "Digitalsolution",  
    "Division",  
    "Entity",  
    "Feature",  
    "Fundinginitiative",  
    "Initiative",  
    "Link",  
    "Location",  
    "Organization",  
    "Person",  
    "Platform",  
    "Policy",  
    "Program"  
    "Resource",  
    "Role",  
    "Schema",  
    "Service",  
    "Standard",  
    "Technology",  
    "Technologyplatform",  
    "Technologystack",  
    "Webframework",  
    "Webresource",  
    "Website"  
\]
  • 使用 Neo4j 瀏覽器瀏覽我們新構(gòu)建的知識(shí)圖譜

從傳統(tǒng) RAG 到圖 RAG,賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

好多了!

  • 持續(xù)細(xì)化我們的提取和圖譜構(gòu)建方法

經(jīng)過(guò)所有努力,魔法終于開始了!

考慮以下查詢:

Q: “請(qǐng)告訴我更多關(guān)于 AiSay 的信息,誰(shuí)開發(fā)了這款產(chǎn)品,以及它的優(yōu)勢(shì)和應(yīng)用。另外,請(qǐng)告訴我 AiSay 的獨(dú)特之處。”

基礎(chǔ) RAG: “AiSay 是一款由新加坡政府開發(fā)的 AI 驅(qū)動(dòng)的文檔閱讀器。它可以自動(dòng)檢測(cè)、掃描和理解各種類型的文檔,包括手寫筆記、印刷文章、多語(yǔ)言文本以及結(jié)構(gòu)化/非結(jié)構(gòu)化文檔。與傳統(tǒng)的 OCR 系統(tǒng)不同,AiSay 可以為圖像和 PDF 文件等文檔提供結(jié)構(gòu)化的響應(yīng)。它使用 OCR、文檔問(wèn)答技術(shù)和大型語(yǔ)言模型來(lái)推導(dǎo)出上下文并回答查詢。AiSay 可擴(kuò)展,具有同步和異步調(diào)用選項(xiàng),允許處理大型文件。它在云上托管為無(wú)服務(wù)器,使其在體積上可擴(kuò)展,能夠處理大型文件。AiSay 正在積極開發(fā)中,支持安全性和數(shù)據(jù)分類,最高可達(dá) RESTRICTED/SENSITIVE NORMAL。展望未來(lái),將支持更多文檔類型。AiSay 的獨(dú)特功能包括它能夠?yàn)楦鞣N文檔類型提供結(jié)構(gòu)化的響應(yīng),其可擴(kuò)展性和對(duì)安全性和數(shù)據(jù)分類的支持?!?/p>

圖 RAG: “AiSay 是一款由新加坡政府開發(fā)的 AI 驅(qū)動(dòng)的文檔閱讀器。它是一個(gè)文檔解析器,可以提供結(jié)構(gòu)化的響應(yīng),提取和整合來(lái)自各種文檔的信息到現(xiàn)有系統(tǒng)中。AiSay 可以自動(dòng)檢測(cè)、掃描和理解各種類型的文檔,包括手寫筆記、印刷文章、多語(yǔ)言文本以及結(jié)構(gòu)化/非結(jié)構(gòu)化文檔。與傳統(tǒng)的光學(xué)字符識(shí)別 (OCR) 系統(tǒng)不同,AiSay 可以為圖像 (JPEG、PNG、TFIF) 和 PDF 文件等文檔提供結(jié)構(gòu)化的響應(yīng)。

AiSay 的一些主要優(yōu)勢(shì)包括:

  1. 由于自動(dòng)填寫從文檔上傳中獲取的關(guān)鍵數(shù)據(jù)以進(jìn)行表單提交,從而減少了人工錯(cuò)誤并提高了數(shù)據(jù)準(zhǔn)確性。
  2. 提高了數(shù)字服務(wù)體驗(yàn),因?yàn)橐坏┪臋n上傳,AiSay 可以自動(dòng)填寫關(guān)鍵數(shù)據(jù)。

AiSay 在為各種文檔類型提供結(jié)構(gòu)化響應(yīng)方面獨(dú)樹一幟,支持多種格式和語(yǔ)言。它還為每個(gè)任務(wù)提供置信度得分,以確定是否需要額外支持,從而在置信度高的任務(wù)中實(shí)現(xiàn)最少的人工干預(yù)。此外,AiSay 可擴(kuò)展,因?yàn)樗谠粕贤泄転闊o(wú)服務(wù)器,使其能夠處理大型文件和異步提取過(guò)程?!?/p>

從傳統(tǒng) RAG 到圖 RAG,賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

圖 RAG 與基礎(chǔ) RAG 的比較

在本例中,圖 RAG 與傳統(tǒng) RAG 方法相比的優(yōu)勢(shì)顯而易見(jiàn)。

該響應(yīng)不僅證明了準(zhǔn)確性,而且還豐富了上下文和關(guān)系,提供了一種標(biāo)準(zhǔn) RAG 方法所沒(méi)有的深度。

圖 RAG 的秘密在于它能夠分析用戶的查詢,在圖數(shù)據(jù)庫(kù)中確定相關(guān)數(shù)據(jù),并將這種上下文洞察整合到引導(dǎo) LLM 響應(yīng)的過(guò)程中。

這種方法利用了一個(gè)傳統(tǒng)方法可能錯(cuò)過(guò)的相互關(guān)聯(lián)的信息網(wǎng)絡(luò),從而對(duì)查詢有了更細(xì)致入微的理解。

讓我們?cè)賴L試幾個(gè)例子

Q: “我需要從一些文檔中刪除敏感信息。Govtech 提供哪些具有這些功能的產(chǎn)品?”

基礎(chǔ) RAG: “Govtech 提供 Cloak 和 FileSG 這兩種產(chǎn)品,它們具有幫助從文檔中刪除敏感信息的功能?!?/p>

圖 RAG: “GovTech 提供一款名為 Cloak 的產(chǎn)品,它是一個(gè)用于符合政策的數(shù)據(jù)匿名化的中央隱私工具包。該產(chǎn)品幫助公務(wù)員將數(shù)據(jù)匿名化技術(shù)應(yīng)用于數(shù)據(jù)集,并根據(jù)指南審查重新識(shí)別風(fēng)險(xiǎn)?!?/p>

從傳統(tǒng) RAG 到圖 RAG,賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

我們需要解決你頻繁的操控行為

Q: “DIAB 與 SIaC 有什么不同?”

基礎(chǔ) RAG: “提供的文檔沒(méi)有直接比較數(shù)據(jù)基礎(chǔ)設(shè)施一體化 (DIAB) 與任何名為 SIaC 的東西,也沒(méi)有提及 SIaC。因此,根據(jù)給定的上下文,無(wú)法直接概述 DIAB 和 SIaC 之間的差異。但是,我們可以總結(jié) DIAB 的關(guān)鍵方面如下:

  1. **目的和開發(fā)**: DIAB 由 GovTech 的數(shù)據(jù)科學(xué)與人工智能部門 (DSAID) 開發(fā),旨在作為商業(yè)云政府 (GCC) 上數(shù)據(jù)基礎(chǔ)設(shè)施部署和維護(hù)的加速器。它專門設(shè)計(jì)用于幫助政府機(jī)構(gòu)構(gòu)建、部署和保護(hù)數(shù)據(jù)基礎(chǔ)設(shè)施。
  2. **關(guān)注數(shù)據(jù)基礎(chǔ)設(shè)施**: DIAB 強(qiáng)調(diào)構(gòu)建一致且可擴(kuò)展的數(shù)據(jù)基礎(chǔ)設(shè)施,使機(jī)構(gòu)在設(shè)計(jì)和實(shí)施云基礎(chǔ)設(shè)施時(shí)可以節(jié)省時(shí)間并減少開銷。這種關(guān)注使機(jī)構(gòu)能夠更專注于構(gòu)建應(yīng)用程序?qū)印?/li>
  3. **使用基礎(chǔ)設(shè)施即代碼 (IaC)**: DIAB 利用 IaC 模板和參考架構(gòu)來(lái)幫助進(jìn)行數(shù)據(jù)工程方面的考慮,簡(jiǎn)化設(shè)置和管理數(shù)據(jù)基礎(chǔ)設(shè)施的過(guò)程。

由于沒(méi)有關(guān)于 SIaC 的信息,因此無(wú)法進(jìn)行比較。DIAB 的特點(diǎn)突出了其作為政府機(jī)構(gòu)在云中有效部署和管理數(shù)據(jù)基礎(chǔ)設(shè)施的工具的作用,它利用 IaC 來(lái)提高效率和可擴(kuò)展性?!?/p>

圖 RAG: “DIAB (數(shù)據(jù)基礎(chǔ)設(shè)施一體化) 和 SIaC (安全基礎(chǔ)設(shè)施即代碼) 都是旨在為政府機(jī)構(gòu)簡(jiǎn)化云基礎(chǔ)設(shè)施部署的產(chǎn)品。但是,它們?cè)诰唧w關(guān)注點(diǎn)和功能方面有所不同。

DIAB 作為商業(yè)云政府 (GCC) 上數(shù)據(jù)基礎(chǔ)設(shè)施部署和維護(hù)的加速器。它幫助機(jī)構(gòu)構(gòu)建、部署和保護(hù)數(shù)據(jù)基礎(chǔ)設(shè)施,專注于數(shù)據(jù)工程方面的考慮,并提供基礎(chǔ)設(shè)施即代碼 (IaC) 模板。DIAB 的目標(biāo)是幫助機(jī)構(gòu)構(gòu)建一致且可擴(kuò)展的數(shù)據(jù)基礎(chǔ)設(shè)施,其主要優(yōu)勢(shì)包括易用性、提高效率、內(nèi)置合規(guī)性、部署靈活性和未來(lái)證明。

另一方面,SIaC 提供可定制的模板,用于以安全、合規(guī)和自動(dòng)化的方式部署云基礎(chǔ)設(shè)施。它專注于安全配置來(lái)自云服務(wù)提供商的托管服務(wù)和工具,具有模塊化且易于適應(yīng)的模板。SIaC 的關(guān)鍵功能包括遵守新加坡政府標(biāo)準(zhǔn)、針對(duì)不同用例的模塊化、與 SGTS 組件的集成以及云原生設(shè)計(jì)。

總而言之,雖然 DIAB 和 SIaC 都旨在為政府機(jī)構(gòu)簡(jiǎn)化云基礎(chǔ)設(shè)施部署,但 DIAB 專注于數(shù)據(jù)基礎(chǔ)設(shè)施部署,重點(diǎn)關(guān)注數(shù)據(jù)工程方面的考慮和 IaC 模板,而 SIaC 專注于安全且合規(guī)的云基礎(chǔ)設(shè)施部署,具有可定制的模板和模塊化設(shè)計(jì)?!?/p>

從傳統(tǒng) RAG 到圖 RAG,賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

結(jié)論

從傳統(tǒng)的檢索增強(qiáng)生成 (RAG) 向圖 RAG 的轉(zhuǎn)變,代表了我們與大型語(yǔ)言模型 (LLMs) 交互方式的重要進(jìn)步。

這種轉(zhuǎn)變解決了以下基本挑戰(zhàn):_如何提高 LLMs 提供與上下文相關(guān)的準(zhǔn)確答案以應(yīng)對(duì)復(fù)雜查詢的能力_。

當(dāng)比較這兩種方法時(shí),圖 RAG 在處理與上下文相關(guān)的復(fù)雜查詢方面的優(yōu)勢(shì)變得顯而易見(jiàn)。

傳統(tǒng)的 RAG 技術(shù)往往無(wú)法處理與上下文相關(guān)的復(fù)雜問(wèn)題。

相比之下,圖 RAG 利用了更復(fù)雜的數(shù)據(jù)網(wǎng)絡(luò),提供能捕捉到查詢細(xì)微之處更深刻理解的響應(yīng)。

然而,圖 RAG 的有效性并非一種一刀切的解決方案。

它仍然高度依賴于底層 KGs 的質(zhì)量、深度和廣度。

在 KG 有限或偏向特定領(lǐng)域的場(chǎng)景中,圖 RAG 的性能可能無(wú)法超過(guò)傳統(tǒng) RAG 方法。

盡管如此,這種轉(zhuǎn)變有望導(dǎo)致 AI 系統(tǒng)更好地模仿人類的思維和發(fā)現(xiàn)。

本文轉(zhuǎn)載自 ??DevOpsAI??,作者: GraphRAG

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦