偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<ruby id="utqi9"><progress id="utqi9"></progress></ruby>

<tr id="utqi9"><fieldset id="utqi9"></fieldset></tr>

<ruby id="utqi9"><acronym id="utqi9"><meter id="utqi9"></meter></acronym></ruby>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

RAG從入門到精通系列：基礎(chǔ)RAG

PyTorch研習(xí)社

發(fā)布于 2025-1-17 13:06

瀏覽

0收藏

LLM（Large Language Model，大型語(yǔ)言模型）是一個(gè)功能強(qiáng)大的新平臺(tái)，但它們并不總是使用與我們的任務(wù)相關(guān)的數(shù)據(jù)或者是最新的數(shù)據(jù)進(jìn)行訓(xùn)練。

RAG（Retrieval Augmented Generation，檢索增強(qiáng)生成）是一種將 LLM 與外部數(shù)據(jù)源（例如私有數(shù)據(jù)或最新數(shù)據(jù)）連接的通用方法。它允許 LLM 使用外部數(shù)據(jù)來(lái)生成其輸出。

要想真正掌握 RAG，我們需要學(xué)習(xí)下圖所示的技術(shù)（技巧）：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū) 圖片

這個(gè)圖看起來(lái)很讓人頭大，但是不用擔(dān)心，你來(lái)對(duì)地方了。

本系列教程將從頭開(kāi)始介紹如何建立對(duì) RAG 的理解。

我們先從 Indexing（索引）、Retrieval（檢索）和 Generation（生成）的基礎(chǔ)知識(shí)開(kāi)始。

下面的流程圖說(shuō)明了基礎(chǔ) RAG 的過(guò)程：

我們對(duì)外部文檔建立索引（Indexing）；
根據(jù)用戶的問(wèn)題去檢索（Retrieval）相關(guān)的文檔；
將問(wèn)題和相關(guān)的文檔輸入 LLM 生成（Generation）最終答案。

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū) 圖片

Indexing

我們從加載文檔開(kāi)始學(xué)習(xí) Indexing。LangChain 有超過(guò) 160 種不同的文檔加載器，我們可以使用它們從許多不同的來(lái)源抓取數(shù)據(jù)進(jìn)行 Indexing。

https://python.langchain.com/docs/integrations/document_loaders/

我們將 Question（問(wèn)題）輸入到 Retriever（檢索器），Retriever 也會(huì)加載外部文檔（知識(shí)），然后篩選出與 Question 相關(guān)的文檔：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

我們需要將 Text Representation（文本表示）轉(zhuǎn)成 Numerical Representation（數(shù)值表示）才能更好地實(shí)現(xiàn)相關(guān)性（比如余弦相似度）篩選：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

有很多種方法可以將文本轉(zhuǎn)成數(shù)值表示，典型的有：

Statistical（基于統(tǒng)計(jì)學(xué)）
Machine Learned（基于機(jī)器學(xué)習(xí)）

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

目前最常用的就是使用機(jī)器學(xué)習(xí)方法將文本轉(zhuǎn)成固定長(zhǎng)度的，可捕獲文本語(yǔ)義的 Embedding Vector（嵌入向量）。

有很多開(kāi)源的 Embedding Model（比如 BAAI 系列）可以將文本轉(zhuǎn)成 Embedding Vector。但是這些模型能接受的 Context Window（上下文窗口）有限，一般在 512~8192 個(gè) token（如果你不知道什么是 token 的話，請(qǐng)?zhí)轿哪?/p>

所以正常的流程是我們將外部文檔切分成一個(gè)個(gè) Split，使得這些 Split 的長(zhǎng)度能夠滿足 Embedding Model 的 Context Window：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

到現(xiàn)在，我們已經(jīng)掌握了 Indexing 的理論了，現(xiàn)在可以用 Qwen + BAAI + LangChain + Qdrant 實(shí)踐了。

首先配置 LLM 和 Embedding Model：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

然后加載外部文檔，這里的文檔是一個(gè)網(wǎng)頁(yè)博客：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

正如我之前說(shuō)的， Embedding Model 的 Context Window 有限，我們不能直接把整篇文檔丟進(jìn)去，所以要將原始文檔拆分成一個(gè)個(gè)文檔塊：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

接下來(lái)就是配置 Qdrant 向量數(shù)據(jù)庫(kù)：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

可以閱讀《Qdrant：使用Rust編寫的開(kāi)源向量數(shù)據(jù)庫(kù)&向量搜索引擎》了解一下 Qdrant。

最后一步對(duì)文檔塊建立索引并存到向量數(shù)據(jù)庫(kù)中：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

Retrieval

Retrieval 就是根據(jù)我們提出的問(wèn)題的語(yǔ)義向量（也就是 Embedding Vector）去按照某種距離/相似度衡量方法找出與之相似的 k 個(gè) Split 的語(yǔ)義向量。

下圖演示了一個(gè)在一個(gè) 3D 空間的 Embedding Vector Retrieval：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

Embedding Vector 通常存儲(chǔ)在 Vector Store（向量數(shù)據(jù)庫(kù)）中，Vector Store 實(shí)現(xiàn)了各種比較 Embedding Vector 之間相似度的方法。

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

接下來(lái)我們用在 Indexing 時(shí)構(gòu)建的 Vector Store 構(gòu)建一個(gè) retriever，然后輸入問(wèn)題并進(jìn)行檢索：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

根據(jù)我們?cè)O(shè)定的 k 值，我們檢索出了一個(gè)與問(wèn)題相關(guān)的文檔塊。

Generation

現(xiàn)在我們已經(jīng)能夠根據(jù)用戶的問(wèn)題檢索出與之相關(guān)的知識(shí)片段（Split），那么我們現(xiàn)在需要將這些信息（問(wèn)題 + 知識(shí)片段）輸入 LLM，讓 LLM 幫忙生成一個(gè)有時(shí)事實(shí)依據(jù)（知識(shí)片段）的回答：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

我們需要：

問(wèn)題和知識(shí)片段放到一個(gè)字典中，問(wèn)題放到 Question 這個(gè) key，知識(shí)片段放到 Context 這個(gè) key；
然后通過(guò) PromptTemplate 組成一個(gè) Prompt String；
最后將 Prompt String 輸入 LLM，LLM 再產(chǎn)生回答。

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

看起來(lái)很復(fù)雜，但這就是 LangChain 和 LlamaIndex 這類框架存在的意義：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

細(xì)心的你發(fā)現(xiàn)返回的結(jié)果是一個(gè) AIMessage 對(duì)象，我們可能需要一個(gè)純字符串的輸出結(jié)果；而且檢索過(guò)程和生成過(guò)程是分開(kāi)的，這很不方便。

不過(guò)我們可以借助于 LangChain 將上述檢索和生成過(guò)程鏈（Chain）在一起：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

LangSmith

如果你還是對(duì)整個(gè) RAG 管道過(guò)程很陌生，那么不妨去 LangSmith 頁(yè)面上看一下整個(gè)過(guò)程是怎么被一步步串到一起的：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

LangSmith 是一個(gè)用于構(gòu)建生產(chǎn)級(jí) LLM 應(yīng)用程序的平臺(tái)。它允許我們密切監(jiān)控和評(píng)估我們的應(yīng)用程序，以便我們可以快速、自信地交付。使用 LangSmith，我們可以：

?跟蹤 LLM 應(yīng)用程序
了解 LLM 調(diào)用和應(yīng)用程序邏輯的其他部分。

什么是 token？

token 是模型用來(lái)表示自然語(yǔ)言文本的基本單位，可以直觀的理解為“字”或“詞”。

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

對(duì)于英文文本來(lái)說(shuō)，1 個(gè) token 通常對(duì)應(yīng) 3 至 4 個(gè)字母：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

對(duì)于中文文本來(lái)說(shuō)，1 個(gè) token 通常對(duì)應(yīng)一個(gè)漢字：

RAG從入門到精通系列：基礎(chǔ)RAG-AI.x社區(qū)

GitHub 鏈接：

??https://github.com/realyinchen/RAG/blob/main/01_Indexing_Retrieval_Generation.ipynb??

本文轉(zhuǎn)載自 ??PyTorch研習(xí)社??，作者：南七無(wú)名式

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

6行代碼入門RAG開(kāi)發(fā)

dsqslgj ? 3410瀏覽 ? 0回復(fù)
RAG全景圖：從RAG啟蒙到高級(jí)RAG之36技，再到終章Agentic RAG！

PaperAgent ? 5333瀏覽 ? 0回復(fù)
探索Transformer的演變：從基礎(chǔ)到高級(jí)架構(gòu)

51CTO內(nèi)容精選 ? 3173瀏覽 ? 0回復(fù)
從傳統(tǒng) RAG 到圖 RAG，賦予大型語(yǔ)言模型更強(qiáng)大的知識(shí)力量

NLP前沿1 ? 2706瀏覽 ? 0回復(fù)
一文讀懂：從RAG到多模態(tài)RAG

kede96 ? 4337瀏覽 ? 0回復(fù)
從零到一帶你實(shí)戰(zhàn)RAG混合檢索

AI博物院 ? 4111瀏覽 ? 0回復(fù)
從0到1開(kāi)發(fā)AI Agent（智能體）| LangChain 的快速入門

AI取經(jīng)路 ? 7328瀏覽 ? 0回復(fù)
RAG 架構(gòu)圖解：從基礎(chǔ)到高級(jí)的七種模式

sulu637 ? 8306瀏覽 ? 0回復(fù)
Python語(yǔ)言openAI庫(kù)詳解：從入門到精通（從0到1手把手教程）

唐克 ? 5615瀏覽 ? 0回復(fù)
從數(shù)據(jù)孤島到智能系統(tǒng)：RAG和知識(shí)圖譜的協(xié)同作用

51CTO內(nèi)容精選 ? 2864瀏覽 ? 0回復(fù)
從RAG到RAG+：讓大模型更懂業(yè)務(wù)的權(quán)威指南

芝士AI吃魚(yú) ? 2450瀏覽 ? 0回復(fù)
LLM架構(gòu)從基礎(chǔ)到精通之門控循環(huán)單元（GRUs）

柏企閱文 ? 3166瀏覽 ? 0回復(fù)
我們整理了80余頁(yè)寶典，帶你從入門到精通！文末免費(fèi)領(lǐng)取

51CTO技術(shù)棧 ? 3750瀏覽 ? 0回復(fù)
2W8000字揭秘RAG：從基礎(chǔ)到高級(jí)的逆襲，徹底重塑大模型！

AI論文解讀 ? 3991瀏覽 ? 0回復(fù)
探索智能代理增強(qiáng)檢索生成（Agentic RAG）：從基礎(chǔ)到實(shí)踐

Halo咯咯 ? 2233瀏覽 ? 0回復(fù)
Dify從入門到高階系列一：詳解各種工作流節(jié)點(diǎn)，如何降低LLM開(kāi)發(fā)門檻？

AI博物院 ? 6405瀏覽 ? 1回復(fù)
Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略

AI博物院 ? 1.6w瀏覽 ? 0回復(fù)
從入門到精通：如何在React中構(gòu)建人工智能驅(qū)動(dòng)的梗圖生成器

51CTO內(nèi)容精選 ? 1115瀏覽 ? 0回復(fù)
AutoGen 從入門到高階系列二：詳解AutoGen框架常見(jiàn)的內(nèi)置智能體

AI博物院 ? 1765瀏覽 ? 0回復(fù)

PyTorch研習(xí)社

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

AI Agent 如何改變我們與網(wǎng)頁(yè)的互動(dòng)方式 19h前發(fā)布
想成為頂尖 1% 的 AI 工程師？趕緊學(xué)這 27 個(gè) Python 庫(kù)！爆肝推薦！ 19h前發(fā)布

熱門推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題 0回復(fù)

Deepseek R1 0528實(shí)測(cè)：性能直逼頂尖，普通電腦本地運(yùn)行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測(cè)：真·超DS！ 1回復(fù)

AI Agents開(kāi)源工具棧全解析~ 0回復(fù)

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復(fù)

上一篇：傳統(tǒng)的SaaS將在2025 Agent時(shí)代走向終結(jié)

下一篇： OpenAI o3-mini 干翻了 DeepSeek R1？

社區(qū)精華內(nèi)容

目錄