偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

^{<blockquote id="j9syg"><i id="j9syg"></i></blockquote>}

<sub id="j9syg"><p id="j9syg"></p></sub>

<del id="j9syg"></del>

<sub id="j9syg"></sub>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

從傳統(tǒng) RAG 到圖 RAG，賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量

發(fā)布于 2024-10-25 14:09

瀏覽

0收藏

大型語(yǔ)言模型 (LLMs) 在固定數(shù)據(jù)集上進(jìn)行訓(xùn)練，其知識(shí)在最后一次訓(xùn)練更新時(shí)就已固定。

ChatGPT 的常規(guī)用戶可能已經(jīng)注意到其眾所周知的局限性：“訓(xùn)練數(shù)據(jù)截止到 2021 年 9 月”。

這種局限性會(huì)導(dǎo)致模型產(chǎn)生不準(zhǔn)確或過(guò)時(shí)的響應(yīng)，因?yàn)樗鼈儠?huì)“幻覺(jué)”信息。

在不重新訓(xùn)練或微調(diào)的情況下，用新信息更新模型或增強(qiáng)其上下文理解能力，在資源和人力方面都極具挑戰(zhàn)。

檢索增強(qiáng)生成 (RAG)

檢索增強(qiáng)生成 (簡(jiǎn)稱 RAG) 是一種通過(guò)整合來(lái)自外部可靠知識(shí)庫(kù)的信息來(lái)改進(jìn)大型語(yǔ)言模型 (LLMs) 的技術(shù)。

RAG 背后的原理很簡(jiǎn)單：當(dāng) LLM 被問(wèn)到一個(gè)問(wèn)題時(shí)，它不會(huì)僅僅依賴于自己已有的知識(shí)。

相反，它會(huì)首先從指定的知識(shí)源中查找相關(guān)信息。

這種方法確保了生成的輸出引用了大量語(yǔ)境豐富的數(shù)據(jù)，并通過(guò)最新的相關(guān)信息進(jìn)行增強(qiáng)。

RAG 主要通過(guò)兩個(gè)階段的流程來(lái)運(yùn)作：檢索和內(nèi)容生成。

檢索階段

在檢索階段，算法會(huì)定位并收集與用戶提示或查詢相關(guān)的相關(guān)信息片段。

例如，如果你想搜索福建面食的食譜，你的提示可能是“_福建面食的配料是什么？_”

系統(tǒng)會(huì)識(shí)別出與查詢語(yǔ)義相關(guān)的文檔，并使用相似度度量來(lái)計(jì)算其相關(guān)性，通常使用余弦相似度( Is Cosine-Similarity of Embeddings Really About Similarity?) 來(lái)進(jìn)行計(jì)算。

在收集外部知識(shí)后，它會(huì)將其附加到用戶的提示中，并將其作為增強(qiáng)后的輸入發(fā)送到語(yǔ)言模型。

內(nèi)容生成階段

在隨后的生成階段，LLM 將此增強(qiáng)后的提示與其自身的訓(xùn)練數(shù)據(jù)表示相結(jié)合，以生成一個(gè)針對(duì)用戶查詢的定制化響應(yīng)。

該響應(yīng)提供了一種個(gè)性化和可驗(yàn)證信息，適合通過(guò)聊天機(jī)器人等應(yīng)用程序使用。

從傳統(tǒng) RAG 到圖 RAG，賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

檢索增強(qiáng)生成

RAG 的重要性

在當(dāng)今的技術(shù)領(lǐng)域，LLMs 驅(qū)動(dòng)著眾多自然語(yǔ)言應(yīng)用程序，能夠理解或生成類似人類的文本。

雖然這些模型功能強(qiáng)大，但有時(shí)也會(huì)出現(xiàn)不足。

有時(shí)，它們?cè)谏刹徽_的響應(yīng)時(shí)會(huì)過(guò)于自信，以至于人們很容易被它們極具說(shuō)服力的論據(jù)所影響。

RAG 試圖通過(guò)引導(dǎo) LLM 從可信來(lái)源獲取信息來(lái)緩解這些問(wèn)題，從而保持模型輸出的相關(guān)性和準(zhǔn)確性。

RAG 的局限性

就像生活中的所有事物一樣，傳統(tǒng)的 RAG 方法也有其復(fù)雜性和挑戰(zhàn)。

雖然 RAG 在增強(qiáng) LLMs 的功能方面具有開創(chuàng)性，但它也存在一些局限性，這些局限性會(huì)影響其有效性和適用性。

其中一個(gè)主要挑戰(zhàn)涉及檢索信息的準(zhǔn)確性和數(shù)據(jù)源異質(zhì)性。

為了使 RAG 有效，它通常依賴于多個(gè)外部來(lái)源，這些來(lái)源可能具有不同的格式、標(biāo)準(zhǔn)和可靠性級(jí)別。(例如 PDF、平面文件、Markdown、CSV、Web 內(nèi)容等)

RAG 實(shí)現(xiàn)也遇到了一些困難，例如處理含糊的查詢或需要深入理解上下文的查詢。

這些問(wèn)題是技術(shù)設(shè)計(jì)固有的問(wèn)題，主要源于檢索過(guò)程，檢索過(guò)程有時(shí)會(huì)忽略產(chǎn)生精確響應(yīng)所需的細(xì)微差別。

從傳統(tǒng) RAG 到圖 RAG，賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

上下文很重要，一個(gè)恰當(dāng)?shù)亩禾?hào)也是如此

RAG 的改進(jìn)

提高 RAG 系統(tǒng)的檢索準(zhǔn)確率和效率是自然語(yǔ)言處理和機(jī)器學(xué)習(xí)領(lǐng)域持續(xù)進(jìn)行的研究方向。

為了實(shí)現(xiàn)這些改進(jìn)，可以采取多種策略，但我想要重點(diǎn)介紹兩種在當(dāng)今技術(shù)條件下可以實(shí)現(xiàn)的顯著改進(jìn)。

實(shí)施更復(fù)雜的檢索算法，能夠更好地理解查詢的語(yǔ)義，可以提高檢索到的文檔的相關(guān)性。
有效地索引知識(shí)庫(kù)，以加快檢索過(guò)程，而不犧牲結(jié)果的質(zhì)量。

這將我們引向…

圖 RAG：RAG x 知識(shí)圖譜

圖 RAG 在 RAG 的概念基礎(chǔ)上，利用了知識(shí)圖譜 (KGs)。

這種創(chuàng)新方法是由 NebulaGraph 首創(chuàng)的概念，它通過(guò)整合圖數(shù)據(jù)庫(kù)，改變了 LLMs 解釋和響應(yīng)查詢的方式。

圖 RAG 通過(guò)將 KGs 中的結(jié)構(gòu)化數(shù)據(jù)整合到 LLM 的處理中，為模型的響應(yīng)提供了更細(xì)致入微和信息豐富的基礎(chǔ)。

KGs 是對(duì)現(xiàn)實(shí)世界實(shí)體及其關(guān)系的結(jié)構(gòu)化表示。

它們包含兩個(gè)主要部分：_節(jié)點(diǎn)_和_邊_。

節(jié)點(diǎn)代表單個(gè)實(shí)體，例如_人物_、_地點(diǎn)_、_物體_或_概念_。

另一方面，邊代表這些節(jié)點(diǎn)之間的關(guān)系，表明它們是如何相互連接的。

從傳統(tǒng) RAG 到圖 RAG，賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

一個(gè)簡(jiǎn)單的知識(shí)圖譜

這種結(jié)構(gòu)極大地提高了 LLMs 生成有見(jiàn)地的響應(yīng)的能力，因?yàn)樗鼓Ｐ湍軌蛟L問(wèn)精確且與上下文相關(guān)的數(shù)據(jù)。

圖 RAG 的創(chuàng)新之處在于它將圖數(shù)據(jù)庫(kù)與 LLMs 整合，以在生成響應(yīng)之前豐富模型的上下文。

一些流行的圖數(shù)據(jù)庫(kù)產(chǎn)品包括 Ontotext, NebulaGraph 和 Neo4J。

圖 RAG 的重要意義

隨著 LLMs 繼續(xù)在復(fù)雜性和能力方面不斷發(fā)展，圖 RAG 有可能對(duì) AI 領(lǐng)域產(chǎn)生重大影響。

以下是我對(duì)這種整合如何演變的展望：

未來(lái) LLMs 預(yù)計(jì)將表現(xiàn)出對(duì)復(fù)雜查詢的改進(jìn)理解能力和推理能力。

圖 RAG 可以利用這些進(jìn)步來(lái)提供更精確、更富含上下文的答案。

來(lái)自知識(shí)圖譜的結(jié)構(gòu)化知識(shí)，再加上更復(fù)雜的 LLMs，可能會(huì)導(dǎo)致 AI 在理解抽象概念、推理以及生成細(xì)致入微的響應(yīng)方面取得突破。

隨著 LLMs 的持續(xù)進(jìn)步，它們與知識(shí)圖譜的整合可能會(huì)變得更加動(dòng)態(tài)和無(wú)縫。

這可能包括根據(jù)全球事件或發(fā)現(xiàn)實(shí)時(shí)更新 KGs。

LLMs 可以通過(guò)將從用戶交互或其他數(shù)據(jù)源收集的新信息整合到知識(shí)圖譜中，在自動(dòng)增強(qiáng)和更新知識(shí)圖譜方面發(fā)揮作用。

使用諸如來(lái)自人類反饋的強(qiáng)化學(xué)習(xí) (RLHF) 和來(lái)自 AI 反饋的強(qiáng)化學(xué)習(xí) (RLAIF) 等技術(shù)可以進(jìn)一步幫助模型與人類偏好保持一致，并遵守 HHH (不是摔跤手，而是幫助、誠(chéng)實(shí)、無(wú)害) 原則。

隨著英偉達(dá)努力實(shí)現(xiàn) AI 計(jì)算的民主化，未來(lái) LLMs 和圖 RAG 實(shí)現(xiàn)的進(jìn)步將集中在提高計(jì)算效率和可擴(kuò)展性方面。

這種轉(zhuǎn)變將使圖 RAG 能夠應(yīng)用于更廣泛的應(yīng)用程序，包括那些需要實(shí)時(shí)響應(yīng)或在資源有限的環(huán)境中運(yùn)行的應(yīng)用程序。

未來(lái) LLMs 預(yù)計(jì)將在多個(gè)領(lǐng)域擁有更廣泛、更深入的知識(shí)。圖 RAG 可以促進(jìn)跨不同領(lǐng)域的知識(shí)轉(zhuǎn)移，這將使生成從不同領(lǐng)域獲取信息的見(jiàn)解或解決方案成為可能。

例如，應(yīng)用認(rèn)知科學(xué)的發(fā)現(xiàn)可能會(huì)導(dǎo)致開發(fā)更自然的人機(jī)交互模型，或者將網(wǎng)絡(luò)安全與心理學(xué)相結(jié)合可能會(huì)提高安全措施的有效性。

隨著圖 RAG 技術(shù)的發(fā)展，采用諸如資源描述框架 (RDF) 等知識(shí)圖譜標(biāo)準(zhǔn)可以提高各種系統(tǒng)之間的互操作性。

這可能意味著不同的實(shí)現(xiàn)可以相互交互和協(xié)作，從而推動(dòng)更廣泛的采用和創(chuàng)新。

從傳統(tǒng) RAG 到圖 RAG，賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

圖 RAG 演示

在本演示中，我們將使用 Govtech 的開發(fā)者門戶網(wǎng)站 中的產(chǎn)品信息作為我們的知識(shí)庫(kù)。

從傳統(tǒng) RAG 到圖 RAG，賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

數(shù)據(jù)集示例。我們將很快將其轉(zhuǎn)換為可用的格式。

設(shè)置

使用Neo4j Desktop啟動(dòng)一個(gè) Neo4j 本地實(shí)例

從傳統(tǒng) RAG 到圖 RAG，賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

Neo4j Desktop 界面

使用 LangChain 本地連接到 Neo4j 數(shù)據(jù)庫(kù)。好消息是 LangChain 有一個(gè)現(xiàn)成的模板可以輕松設(shè)置。

提取

使用提示工程和 LLM 提取信息、節(jié)點(diǎn)及其連接。以下是一個(gè)提示示例：

\# 創(chuàng)建知識(shí)圖譜的說(shuō)明  
\## 概述  
您被設(shè)計(jì)用于將數(shù)據(jù)組織成知識(shí)圖譜。  
\- \*\*節(jié)點(diǎn)\*\*: 代表實(shí)體和想法。  
\- 目標(biāo)是確保知識(shí)圖譜簡(jiǎn)單易懂，便于廣泛使用。\## 節(jié)點(diǎn)標(biāo)記  
\- \*\*一致性\*\*: 對(duì)節(jié)點(diǎn)使用簡(jiǎn)單的標(biāo)簽。例如，將任何組織實(shí)體標(biāo)記為“公司”，而不是使用諸如“Facebook”或“Amazon”之類的術(shù)語(yǔ)。  
\- \*\*節(jié)點(diǎn)標(biāo)識(shí)符\*\*: 選擇文本或可理解的標(biāo)識(shí)符，而不是數(shù)字標(biāo)識(shí)符。  
  - \*\*允許的節(jié)點(diǎn)標(biāo)簽\*\*: 如果存在特定允許的節(jié)點(diǎn)標(biāo)簽，請(qǐng)?jiān)诖颂幜谐觥? 
  - \*\*允許的關(guān)系類型\*\*: 如果存在特定允許的關(guān)系類型，請(qǐng)?jiān)诖颂幜谐觥?
\## 管理數(shù)值數(shù)據(jù)和日期  
\- 將數(shù)值信息直接作為節(jié)點(diǎn)的屬性集成。  
\- \*\*集成日期/數(shù)字\*\*: 不要為日期或數(shù)字創(chuàng)建單獨(dú)的節(jié)點(diǎn)，而是將它們作為屬性附加。  
\- \*\*屬性格式\*\*: 使用鍵值對(duì)格式。  
\- \*\*避免使用引號(hào)\*\*: 在屬性值中不要使用轉(zhuǎn)義引號(hào)。  
\- \*\*鍵命名\*\*: 采用 camelCase 命名鍵，例如 \`dateTime\`。

\## 一致性  
\- \*\*實(shí)體一致性\*\*: 確保跨不同提及或引用的實(shí)體一致地識(shí)別。

## 遵守指南  
嚴(yán)格遵守這些說(shuō)明是強(qiáng)制性的。不遵守將導(dǎo)致終止。

圖譜構(gòu)建

使用 CSVLoader 和文檔分段來(lái)處理我們的文檔
將提取的信息映射到圖節(jié)點(diǎn)和關(guān)系
通過(guò)我們的提取管道處理文檔，并將信息存儲(chǔ)在 Neo4j 中

從傳統(tǒng) RAG 到圖 RAG，賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

該過(guò)程花費(fèi)了近一個(gè)小時(shí)，最終產(chǎn)生了提取的節(jié)點(diǎn)標(biāo)簽列表

不幸的是，并非所有節(jié)點(diǎn)標(biāo)簽都對(duì)我們的上下文有用，或者符合我們的需求。

{  
  "identity": 1040,  
  "labels": \[  
    "Feedbackstatus"  
  \],  
  "properties": {  
    "id": "Feedback-Success",  
    "message": "已發(fā)送。感謝您的反饋！”  
  },  
  "elementId": "4:81cd2613-0f18-49c1-8134-761643e88b7a:1040"  
},  
{  
  "identity": 1582,  
  "labels": \[  
    "Feedbackstatus"  
  \],  
  "properties": {  
    "id": "Feedbacksuccess",  
    "status": "已發(fā)送。感謝您的反饋！”  
  },  
  "elementId": "4:81cd2613-0f18-49c1-8134-761643e88b7a:1582"  
},  
{  
  "identity": 1405,  
  "labels": \[  
    "Header"  
  \],  
  "properties": {  
    "id": "Modalcardhead",  
    "class": "sgds-modal-card-head"  
  },  
  "elementId": "4:81cd2613-0f18-49c1-8134-761643e88b7a:1405"  
},  
{  
  "identity": 1112,  
  "labels": \[  
    "Feedbackindicator"  
  \],  
  "properties": {  
    "id": "Feedbacksuccess",  
    "title": "check",  
    "message": "已發(fā)送。感謝您的反饋！”  
  },  
  "elementId": "4:81cd2613-0f18-49c1-8134-761643e88b7a:1112"  
...

評(píng)估和細(xì)化

我們將指定 LLM 應(yīng)該提取哪些節(jié)點(diǎn)標(biāo)簽來(lái)細(xì)化我們的方法

permissible\_nodes\_to\_extract = \[  
    "Aisubfield",  
    "Application",  
    "Cloudservice",  
    "Concept",  
    "Digitalsolution",  
    "Division",  
    "Entity",  
    "Feature",  
    "Fundinginitiative",  
    "Initiative",  
    "Link",  
    "Location",  
    "Organization",  
    "Person",  
    "Platform",  
    "Policy",  
    "Program"  
    "Resource",  
    "Role",  
    "Schema",  
    "Service",  
    "Standard",  
    "Technology",  
    "Technologyplatform",  
    "Technologystack",  
    "Webframework",  
    "Webresource",  
    "Website"  
\]

使用 Neo4j 瀏覽器瀏覽我們新構(gòu)建的知識(shí)圖譜

從傳統(tǒng) RAG 到圖 RAG，賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

好多了！

持續(xù)細(xì)化我們的提取和圖譜構(gòu)建方法

經(jīng)過(guò)所有努力，魔法終于開始了！

考慮以下查詢：

Q: “請(qǐng)告訴我更多關(guān)于 AiSay 的信息，誰(shuí)開發(fā)了這款產(chǎn)品，以及它的優(yōu)勢(shì)和應(yīng)用。另外，請(qǐng)告訴我 AiSay 的獨(dú)特之處。”

基礎(chǔ) RAG: “AiSay 是一款由新加坡政府開發(fā)的 AI 驅(qū)動(dòng)的文檔閱讀器。它可以自動(dòng)檢測(cè)、掃描和理解各種類型的文檔，包括手寫筆記、印刷文章、多語(yǔ)言文本以及結(jié)構(gòu)化/非結(jié)構(gòu)化文檔。與傳統(tǒng)的 OCR 系統(tǒng)不同，AiSay 可以為圖像和 PDF 文件等文檔提供結(jié)構(gòu)化的響應(yīng)。它使用 OCR、文檔問(wèn)答技術(shù)和大型語(yǔ)言模型來(lái)推導(dǎo)出上下文并回答查詢。AiSay 可擴(kuò)展，具有同步和異步調(diào)用選項(xiàng)，允許處理大型文件。它在云上托管為無(wú)服務(wù)器，使其在體積上可擴(kuò)展，能夠處理大型文件。AiSay 正在積極開發(fā)中，支持安全性和數(shù)據(jù)分類，最高可達(dá) RESTRICTED/SENSITIVE NORMAL。展望未來(lái)，將支持更多文檔類型。AiSay 的獨(dú)特功能包括它能夠?yàn)楦鞣N文檔類型提供結(jié)構(gòu)化的響應(yīng)，其可擴(kuò)展性和對(duì)安全性和數(shù)據(jù)分類的支持?！?/p>

圖 RAG: “AiSay 是一款由新加坡政府開發(fā)的 AI 驅(qū)動(dòng)的文檔閱讀器。它是一個(gè)文檔解析器，可以提供結(jié)構(gòu)化的響應(yīng)，提取和整合來(lái)自各種文檔的信息到現(xiàn)有系統(tǒng)中。AiSay 可以自動(dòng)檢測(cè)、掃描和理解各種類型的文檔，包括手寫筆記、印刷文章、多語(yǔ)言文本以及結(jié)構(gòu)化/非結(jié)構(gòu)化文檔。與傳統(tǒng)的光學(xué)字符識(shí)別 (OCR) 系統(tǒng)不同，AiSay 可以為圖像 (JPEG、PNG、TFIF) 和 PDF 文件等文檔提供結(jié)構(gòu)化的響應(yīng)。

AiSay 的一些主要優(yōu)勢(shì)包括：

由于自動(dòng)填寫從文檔上傳中獲取的關(guān)鍵數(shù)據(jù)以進(jìn)行表單提交，從而減少了人工錯(cuò)誤并提高了數(shù)據(jù)準(zhǔn)確性。
提高了數(shù)字服務(wù)體驗(yàn)，因?yàn)橐坏┪臋n上傳，AiSay 可以自動(dòng)填寫關(guān)鍵數(shù)據(jù)。

AiSay 在為各種文檔類型提供結(jié)構(gòu)化響應(yīng)方面獨(dú)樹一幟，支持多種格式和語(yǔ)言。它還為每個(gè)任務(wù)提供置信度得分，以確定是否需要額外支持，從而在置信度高的任務(wù)中實(shí)現(xiàn)最少的人工干預(yù)。此外，AiSay 可擴(kuò)展，因?yàn)樗谠粕贤泄転闊o(wú)服務(wù)器，使其能夠處理大型文件和異步提取過(guò)程?！?/p>

從傳統(tǒng) RAG 到圖 RAG，賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

圖 RAG 與基礎(chǔ) RAG 的比較

在本例中，圖 RAG 與傳統(tǒng) RAG 方法相比的優(yōu)勢(shì)顯而易見(jiàn)。

該響應(yīng)不僅證明了準(zhǔn)確性，而且還豐富了上下文和關(guān)系，提供了一種標(biāo)準(zhǔn) RAG 方法所沒(méi)有的深度。

圖 RAG 的秘密在于它能夠分析用戶的查詢，在圖數(shù)據(jù)庫(kù)中確定相關(guān)數(shù)據(jù)，并將這種上下文洞察整合到引導(dǎo) LLM 響應(yīng)的過(guò)程中。

這種方法利用了一個(gè)傳統(tǒng)方法可能錯(cuò)過(guò)的相互關(guān)聯(lián)的信息網(wǎng)絡(luò)，從而對(duì)查詢有了更細(xì)致入微的理解。

讓我們?cè)賴L試幾個(gè)例子

Q: “我需要從一些文檔中刪除敏感信息。Govtech 提供哪些具有這些功能的產(chǎn)品？”

基礎(chǔ) RAG: “Govtech 提供 Cloak 和 FileSG 這兩種產(chǎn)品，它們具有幫助從文檔中刪除敏感信息的功能?！?/p>

圖 RAG: “GovTech 提供一款名為 Cloak 的產(chǎn)品，它是一個(gè)用于符合政策的數(shù)據(jù)匿名化的中央隱私工具包。該產(chǎn)品幫助公務(wù)員將數(shù)據(jù)匿名化技術(shù)應(yīng)用于數(shù)據(jù)集，并根據(jù)指南審查重新識(shí)別風(fēng)險(xiǎn)?！?/p>

從傳統(tǒng) RAG 到圖 RAG，賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

我們需要解決你頻繁的操控行為

Q: “DIAB 與 SIaC 有什么不同？”

基礎(chǔ) RAG: “提供的文檔沒(méi)有直接比較數(shù)據(jù)基礎(chǔ)設(shè)施一體化 (DIAB) 與任何名為 SIaC 的東西，也沒(méi)有提及 SIaC。因此，根據(jù)給定的上下文，無(wú)法直接概述 DIAB 和 SIaC 之間的差異。但是，我們可以總結(jié) DIAB 的關(guān)鍵方面如下：

**目的和開發(fā)**: DIAB 由 GovTech 的數(shù)據(jù)科學(xué)與人工智能部門 (DSAID) 開發(fā)，旨在作為商業(yè)云政府 (GCC) 上數(shù)據(jù)基礎(chǔ)設(shè)施部署和維護(hù)的加速器。它專門設(shè)計(jì)用于幫助政府機(jī)構(gòu)構(gòu)建、部署和保護(hù)數(shù)據(jù)基礎(chǔ)設(shè)施。
**關(guān)注數(shù)據(jù)基礎(chǔ)設(shè)施**: DIAB 強(qiáng)調(diào)構(gòu)建一致且可擴(kuò)展的數(shù)據(jù)基礎(chǔ)設(shè)施，使機(jī)構(gòu)在設(shè)計(jì)和實(shí)施云基礎(chǔ)設(shè)施時(shí)可以節(jié)省時(shí)間并減少開銷。這種關(guān)注使機(jī)構(gòu)能夠更專注于構(gòu)建應(yīng)用程序?qū)印?/li>
**使用基礎(chǔ)設(shè)施即代碼 (IaC)**: DIAB 利用 IaC 模板和參考架構(gòu)來(lái)幫助進(jìn)行數(shù)據(jù)工程方面的考慮，簡(jiǎn)化設(shè)置和管理數(shù)據(jù)基礎(chǔ)設(shè)施的過(guò)程。

由于沒(méi)有關(guān)于 SIaC 的信息，因此無(wú)法進(jìn)行比較。DIAB 的特點(diǎn)突出了其作為政府機(jī)構(gòu)在云中有效部署和管理數(shù)據(jù)基礎(chǔ)設(shè)施的工具的作用，它利用 IaC 來(lái)提高效率和可擴(kuò)展性?！?/p>

圖 RAG: “DIAB (數(shù)據(jù)基礎(chǔ)設(shè)施一體化) 和 SIaC (安全基礎(chǔ)設(shè)施即代碼) 都是旨在為政府機(jī)構(gòu)簡(jiǎn)化云基礎(chǔ)設(shè)施部署的產(chǎn)品。但是，它們?cè)诰唧w關(guān)注點(diǎn)和功能方面有所不同。

DIAB 作為商業(yè)云政府 (GCC) 上數(shù)據(jù)基礎(chǔ)設(shè)施部署和維護(hù)的加速器。它幫助機(jī)構(gòu)構(gòu)建、部署和保護(hù)數(shù)據(jù)基礎(chǔ)設(shè)施，專注于數(shù)據(jù)工程方面的考慮，并提供基礎(chǔ)設(shè)施即代碼 (IaC) 模板。DIAB 的目標(biāo)是幫助機(jī)構(gòu)構(gòu)建一致且可擴(kuò)展的數(shù)據(jù)基礎(chǔ)設(shè)施，其主要優(yōu)勢(shì)包括易用性、提高效率、內(nèi)置合規(guī)性、部署靈活性和未來(lái)證明。

另一方面，SIaC 提供可定制的模板，用于以安全、合規(guī)和自動(dòng)化的方式部署云基礎(chǔ)設(shè)施。它專注于安全配置來(lái)自云服務(wù)提供商的托管服務(wù)和工具，具有模塊化且易于適應(yīng)的模板。SIaC 的關(guān)鍵功能包括遵守新加坡政府標(biāo)準(zhǔn)、針對(duì)不同用例的模塊化、與 SGTS 組件的集成以及云原生設(shè)計(jì)。

總而言之，雖然 DIAB 和 SIaC 都旨在為政府機(jī)構(gòu)簡(jiǎn)化云基礎(chǔ)設(shè)施部署，但 DIAB 專注于數(shù)據(jù)基礎(chǔ)設(shè)施部署，重點(diǎn)關(guān)注數(shù)據(jù)工程方面的考慮和 IaC 模板，而 SIaC 專注于安全且合規(guī)的云基礎(chǔ)設(shè)施部署，具有可定制的模板和模塊化設(shè)計(jì)?！?/p>

從傳統(tǒng) RAG 到圖 RAG，賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量-AI.x社區(qū)

結(jié)論

從傳統(tǒng)的檢索增強(qiáng)生成 (RAG) 向圖 RAG 的轉(zhuǎn)變，代表了我們與大型語(yǔ)言模型 (LLMs) 交互方式的重要進(jìn)步。

這種轉(zhuǎn)變解決了以下基本挑戰(zhàn)：_如何提高 LLMs 提供與上下文相關(guān)的準(zhǔn)確答案以應(yīng)對(duì)復(fù)雜查詢的能力_。

當(dāng)比較這兩種方法時(shí)，圖 RAG 在處理與上下文相關(guān)的復(fù)雜查詢方面的優(yōu)勢(shì)變得顯而易見(jiàn)。

傳統(tǒng)的 RAG 技術(shù)往往無(wú)法處理與上下文相關(guān)的復(fù)雜問(wèn)題。

相比之下，圖 RAG 利用了更復(fù)雜的數(shù)據(jù)網(wǎng)絡(luò)，提供能捕捉到查詢細(xì)微之處更深刻理解的響應(yīng)。

然而，圖 RAG 的有效性并非一種一刀切的解決方案。

它仍然高度依賴于底層 KGs 的質(zhì)量、深度和廣度。

在 KG 有限或偏向特定領(lǐng)域的場(chǎng)景中，圖 RAG 的性能可能無(wú)法超過(guò)傳統(tǒng) RAG 方法。

盡管如此，這種轉(zhuǎn)變有望導(dǎo)致 AI 系統(tǒng)更好地模仿人類的思維和發(fā)現(xiàn)。

本文轉(zhuǎn)載自 ??DevOpsAI??，作者： GraphRAG

標(biāo)簽

語(yǔ)言模型

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

RAG全景圖：從RAG啟蒙到高級(jí)RAG之36技，再到終章Agentic RAG！

PaperAgent ? 6593瀏覽 ? 0回復(fù)
圖遇見(jiàn)大型語(yǔ)言模型：進(jìn)展與未來(lái)方向的研究

AIRoobt ? 8860瀏覽 ? 0回復(fù)
圖遇見(jiàn)大型語(yǔ)言模型：進(jìn)展與未來(lái)方向的研究

AIRoobt ? 6010瀏覽 ? 0回復(fù)
大型語(yǔ)言模型的知識(shí)融合（ICLR2024）

AIRoobt ? 4229瀏覽 ? 0回復(fù)
ChatGLM: 從GLM-130B到GLM-4的系列大型語(yǔ)言模型

AIRoobt ? 8943瀏覽 ? 0回復(fù)
一文讀懂：從RAG到多模態(tài)RAG

kede96 ? 5864瀏覽 ? 0回復(fù)
從RAG到TAG：探索表增強(qiáng)生成（TAG）的力量

Halo咯咯 ? 5370瀏覽 ? 0回復(fù)
從零到一帶你實(shí)戰(zhàn)RAG混合檢索

AI博物院 ? 5719瀏覽 ? 0回復(fù)
從數(shù)據(jù)孤島到智能系統(tǒng)：RAG和知識(shí)圖譜的協(xié)同作用

51CTO內(nèi)容精選 ? 4283瀏覽 ? 0回復(fù)
從RAG到RAG+：讓大模型更懂業(yè)務(wù)的權(quán)威指南

芝士AI吃魚 ? 3533瀏覽 ? 0回復(fù)
圖數(shù)據(jù)庫(kù)的剪枝在大型語(yǔ)言模型中的知識(shí)表示

51CTO內(nèi)容精選 ? 2810瀏覽 ? 0回復(fù)
文檔解析技術(shù)指南：從傳統(tǒng)Pipeline到端到端大模型

Baihai_IDP ? 4327瀏覽 ? 0回復(fù)
RAG從入門到精通系列：基礎(chǔ)RAG

PyTorch研習(xí)社 ? 4436瀏覽 ? 0回復(fù)
從GraphRAG到PIKE-RAG，微軟發(fā)布復(fù)雜企業(yè)場(chǎng)景下的私域知識(shí)提取與推理新突破

AI博物院 ? 6208瀏覽 ? 0回復(fù)
語(yǔ)言、邏輯與大型語(yǔ)言模型——從古代哲學(xué)抽象思維到人工智能的演進(jìn)

上堵吟1 ? 4205瀏覽 ? 0回復(fù)
Agentic RAG 目前最強(qiáng)大的RAG實(shí)現(xiàn)方式

數(shù)智飛輪 ? 6245瀏覽 ? 0回復(fù)
進(jìn)階指南：如何讓你的AI應(yīng)用更強(qiáng)大、更持久？這17個(gè)RAG技巧助你把應(yīng)用做到極致

Halo咯咯 ? 2919瀏覽 ? 0回復(fù)
告別傳統(tǒng) RAG，迎接 GraphRAG：知識(shí)圖譜+本體=更強(qiáng) AI

PyTorch研習(xí)社 ? 6016瀏覽 ? 0回復(fù)
告別傳統(tǒng) RAG，迎接 GraphRAG：知識(shí)圖譜+本體=更強(qiáng) AI

AI大模型觀察站 ? 1848瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

字節(jié)的這個(gè)新模型，牛了！ 2025-09-22 07:05:49發(fā)布
Agent KB：讓Agent越用越聰明！ 2025-07-21 06:35:18發(fā)布

熱門推薦

別再怪AI“聽不懂人話”了，90%的返工和錯(cuò)誤，都錯(cuò)在你下達(dá)指令的第一句話 0回復(fù)

阿里新一代企業(yè)級(jí)多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁(yè)P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

關(guān)于RAG系統(tǒng)在多輪對(duì)話中的問(wèn)題改寫(優(yōu)化)方法—使用歷史記錄改寫問(wèn)題 0回復(fù)

DeepSeek 成長(zhǎng)史：從量化投資到 AI 革命的一個(gè) “非主流” 量化大佬的 AI 夢(mèng) 0回復(fù)

上一篇：大模型數(shù)學(xué)能力翻車實(shí)錘！Apple新研究暴露真相!

下一篇：傳統(tǒng)RAG涼涼？多模態(tài)RAG帶來(lái)工業(yè)級(jí)革命

社區(qū)精華內(nèi)容

目錄

<blockquote id="9zokx"></blockquote>

<abbr id="9zokx"></abbr>

<style id="9zokx"></style><cite id="9zokx"><rp id="9zokx"><form id="9zokx"></form></rp></cite>