偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<kbd id="pikoe"><rp id="pikoe"></rp></kbd>

<nav id="pikoe"><strong id="pikoe"><dl id="pikoe"></dl></strong></nav>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

從零實(shí)現(xiàn)大模型-GraphRAG，構(gòu)建LLM中的關(guān)系數(shù)據(jù)庫(kù) 原創(chuàng)

發(fā)布于 2024-7-17 07:04

瀏覽

0收藏

傳統(tǒng)RAG

LLM預(yù)訓(xùn)練和微調(diào)一般都是基于公開的互聯(lián)網(wǎng)數(shù)據(jù)，不可能包含公司內(nèi)部私有數(shù)據(jù)，如果你問有關(guān)某公司的運(yùn)營(yíng)情況，直接基于模型參數(shù)生成的回答可能和胡說八道沒什么兩樣。

RAG（Retrieval-Augmented Generation）的思想就是將私有數(shù)據(jù)作為參考信息傳遞給LLM。這些私有數(shù)據(jù)除了作為一種補(bǔ)充信息，也可以作為一種限制，能避免LLM產(chǎn)生幻覺。

參考信息一般以文本、圖片等非結(jié)構(gòu)化形式存在。

RAG的流程是：

從零實(shí)現(xiàn)大模型-GraphRAG，構(gòu)建LLM中的關(guān)系數(shù)據(jù)庫(kù) -AI.x社區(qū)

1.首先要將文本劃分成片段，然后將片段轉(zhuǎn)換成向量存儲(chǔ)到向量數(shù)據(jù)庫(kù)中備用，這個(gè)向量就是這段文本語(yǔ)義信息的數(shù)字表示。

2.將用戶查詢轉(zhuǎn)換成向量。并與所有文本片段向量進(jìn)行相似度計(jì)算，取出top k個(gè)片段。

3.將用戶查詢和k個(gè)文本片段組織成特定prompt格式輸入到LLM中。

（計(jì)算文本的向量可以調(diào)用API或者使用像llamaindex這樣的庫(kù)）

GraphRAG

但傳統(tǒng)的RAG仍有一些限制。

例如，基于某個(gè)公司的運(yùn)營(yíng)數(shù)據(jù)搭建RAG，由于LLM上下文大小的限制，劃分的文本片段不可能太大，所以每個(gè)文本片段不可能包含太多信息。

如果你問某個(gè)員工去年的銷售業(yè)績(jī)，基于RAG，LLM很可能會(huì)給出準(zhǔn)確回答，因?yàn)槟硞€(gè)文本片段很可能包含了某個(gè)員工的年終總結(jié)信息。

但如果你問該員工所在團(tuán)隊(duì)去年的銷售情況呢？就算某個(gè)文本片段包含了該團(tuán)隊(duì)的銷售數(shù)據(jù)，LLM也很難通過該員工找到團(tuán)隊(duì)的其它成員。

微軟最近提出的GraphRAG(Graph-based Retrieval Augmented Generation)就是解決這個(gè)問題。

GraphRAG就是將圖和傳統(tǒng)的RAG結(jié)合了起來(lái)。

構(gòu)造知識(shí)圖譜

圖是由節(jié)點(diǎn)和邊組成的，節(jié)點(diǎn)可以表示各種實(shí)體，邊表示實(shí)體之間的關(guān)系。

GraphRAG的核心就是構(gòu)造知識(shí)圖譜，可以通過GPT4或者使用像llamaindex（KnowledgeGraphIndex）這樣的庫(kù)構(gòu)造知識(shí)圖譜。

從零實(shí)現(xiàn)大模型-GraphRAG，構(gòu)建LLM中的關(guān)系數(shù)據(jù)庫(kù) -AI.x社區(qū)

將公司運(yùn)營(yíng)文檔構(gòu)造成知識(shí)圖譜：

1.識(shí)別出文檔中包含的實(shí)體以及實(shí)體之間的關(guān)系（員工，同事）

2.將實(shí)體進(jìn)行聚類（同組同事）

3.對(duì)每個(gè)聚類進(jìn)行總結(jié)（銷售情況）

4.將實(shí)體進(jìn)行向量化，轉(zhuǎn)換到圖向量空間

5.提取實(shí)體對(duì)應(yīng)的原始文本，并轉(zhuǎn)換成向量

Query

當(dāng)用戶提問時(shí)，首先在知識(shí)圖譜中找到與用戶提問語(yǔ)義相關(guān)的實(shí)體，同時(shí)找到與實(shí)體相關(guān)的原始文本，最后將這些信息組織成特定prompt格式輸入給LLM。

從零實(shí)現(xiàn)大模型-GraphRAG，構(gòu)建LLM中的關(guān)系數(shù)據(jù)庫(kù) -AI.x社區(qū)

References

[1] https://github.com/microsoft/graphrag

[2] https://microsoft.github.io/graphrag/

[3] ??https://www.microsoft.com/en-us/research/blog/graphrag-unlocking-llm-discovery-on-narrative-private-data/??

本文轉(zhuǎn)載自公眾號(hào)人工智能大講堂

原文鏈接：??https://mp.weixin.qq.com/s/q2BRAiivIFNXWyQIbwx18Q??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

怎么看大模型、RAG、Agent、知識(shí)庫(kù)、向量數(shù)據(jù)庫(kù)、知識(shí)圖譜、AGI的區(qū)別和聯(lián)系？

玄姐聊AGI ? 8039瀏覽 ? 0回復(fù)
一文搞懂大模型、RAG、函數(shù)調(diào)用、Agent、知識(shí)庫(kù)、向量數(shù)據(jù)庫(kù)、知識(shí)圖譜、AGI的區(qū)別和聯(lián)系??！

玄姐聊AGI ? 1.8w瀏覽 ? 0回復(fù)
從零實(shí)現(xiàn)大模型-GPT2指令微調(diào)

魚蟲子 ? 5312瀏覽 ? 0回復(fù)
從零實(shí)現(xiàn)大模型-BERT微調(diào)

魚蟲子 ? 4667瀏覽 ? 0回復(fù)
從零實(shí)現(xiàn)大模型-RLHF：Reinforcement Learning from Human Feedback

魚蟲子 ? 6253瀏覽 ? 0回復(fù)
從零實(shí)現(xiàn)大模型-GPT2任務(wù)微調(diào)

魚蟲子 ? 4899瀏覽 ? 0回復(fù)
一文搞懂大模型、RAG、函數(shù)調(diào)用、Agent、知識(shí)庫(kù)、向量數(shù)據(jù)庫(kù)、知識(shí)圖譜、AGI的區(qū)別和聯(lián)系??！

玄姐聊AGI ? 5311瀏覽 ? 0回復(fù)
用 Dify 和 Notion 打造輕量級(jí)金融數(shù)據(jù)庫(kù)

開發(fā)者阿橙 ? 6051瀏覽 ? 0回復(fù)
LangChain-RAG必備：向量數(shù)據(jù)庫(kù)如何CRUD

ermulong ? 4008瀏覽 ? 0回復(fù)
RAG與本地知識(shí)庫(kù)，向量數(shù)據(jù)庫(kù)，以及知識(shí)圖譜的聯(lián)系與區(qū)別

AI探索時(shí)代 ? 7329瀏覽 ? 0回復(fù)
利用 Schemonic 優(yōu)化數(shù)據(jù)庫(kù)模式描述以降低大語(yǔ)言模型成本

AIGC前沿技術(shù)追蹤 ? 3692瀏覽 ? 0回復(fù)
利用Milvus向量數(shù)據(jù)庫(kù)，帶你實(shí)現(xiàn)GraphRAG

AI科技論談 ? 4304瀏覽 ? 0回復(fù)
大模型檢索增強(qiáng)生成之向量數(shù)據(jù)庫(kù)的問題

AI探索時(shí)代 ? 3653瀏覽 ? 0回復(fù)
怎么提升向量數(shù)據(jù)庫(kù)的召回準(zhǔn)確率

AI探索時(shí)代 ? 4316瀏覽 ? 0回復(fù)
別再將LLM當(dāng)成數(shù)據(jù)庫(kù)了

51CTO內(nèi)容精選 ? 3679瀏覽 ? 0回復(fù)
圖數(shù)據(jù)庫(kù)的剪枝在大型語(yǔ)言模型中的知識(shí)表示

51CTO內(nèi)容精選 ? 2806瀏覽 ? 0回復(fù)
爆火 | API 終將淘汰，MCP+LLM+向量數(shù)據(jù)庫(kù)才是 Agent 開發(fā)新范式

玄姐聊AGI ? 4889瀏覽 ? 0回復(fù)
RAG實(shí)戰(zhàn) | 向量數(shù)據(jù)庫(kù)LanceDB指南

周末程序猿 ? 3767瀏覽 ? 0回復(fù)
從零到一構(gòu)建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解

PyTorch研習(xí)社 ? 5057瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

訓(xùn)練大模型時(shí)，顯存都哪去了？ 2024-11-19 12:41:34發(fā)布
生產(chǎn)環(huán)境測(cè)試模型的四種方法 2024-11-15 11:22:05發(fā)布

熱門推薦

阿里新一代企業(yè)級(jí)多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

別再怪AI“聽不懂人話”了，90%的返工和錯(cuò)誤，都錯(cuò)在你下達(dá)指令的第一句話 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁(yè)P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

關(guān)于RAG系統(tǒng)在多輪對(duì)話中的問題改寫(優(yōu)化)方法—使用歷史記錄改寫問題 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對(duì)比，你的選擇是？ 0回復(fù)

上一篇：從零實(shí)現(xiàn)大模型-GPT2任務(wù)微調(diào)

下一篇：最強(qiáng)大模型統(tǒng)計(jì)網(wǎng)站，從此告別LLM選擇恐懼癥！

社區(qū)精華內(nèi)容

目錄

<thead id="nxqmt"><tbody id="nxqmt"><tr id="nxqmt"></tr></tbody></thead>

<pre id="nxqmt"><span id="nxqmt"></span></pre>

<u id="nxqmt"></u><menuitem id="nxqmt"><delect id="nxqmt"></delect></menuitem>

<u id="nxqmt"><var id="nxqmt"><optgroup id="nxqmt"></optgroup></var></u>

<samp id="nxqmt"></samp>