偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<samp id="iqqnw"></samp><pre id="iqqnw"><source id="iqqnw"><dl id="iqqnw"></dl></source></pre>

<abbr id="iqqnw"><samp id="iqqnw"></samp></abbr>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

從檢索增強——RAG看檢索技術(shù)的發(fā)展原創(chuàng)

發(fā)布于 2024-10-9 09:48

瀏覽

0收藏

“ 檢索，一種世界性的難題 ”

檢索技術(shù)或者說搜索技術(shù)(雖然檢索與搜索有一定的區(qū)別)一直是一個世界級的難題，檢索技術(shù)可以說從人類出現(xiàn)就已經(jīng)開始了；只不過那時的檢索不叫檢索，叫找東西，只不過到二十一世紀(jì)之后，隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展，數(shù)據(jù)檢索成為了一個重要手段。

而今天我們就來談?wù)剻z索技術(shù)。

檢索

為什么標(biāo)題是從RAG看檢索技術(shù)？

RAG技術(shù)是在之前的文章中不只一次的介紹過，RAG是大模型技術(shù)的補充，大模型的表現(xiàn)在某種程度上依賴于RAG，而RAG最核心的一點就是更加高效和準(zhǔn)確的檢索。

但檢索技術(shù)卻不是因為RAG技術(shù)才出現(xiàn)的，在RAG技術(shù)出現(xiàn)之前，檢索技術(shù)用的最多的應(yīng)該就是搜索引擎了。

從檢索增強——RAG看檢索技術(shù)的發(fā)展-AI.x社區(qū)

從功能的角度出發(fā)，互聯(lián)網(wǎng)技術(shù)的發(fā)展特別是移動互聯(lián)網(wǎng)時代的來臨，互聯(lián)網(wǎng)每天都會產(chǎn)生大量的數(shù)據(jù)，而怎么把這些數(shù)據(jù)分門別類，讓需要的人快速從繁雜的數(shù)據(jù)中找到有用的東西，這是一個值得思考的問題。

而從技術(shù)的角度來說，在互聯(lián)網(wǎng)技術(shù)出現(xiàn)之前，數(shù)據(jù)或者說資料的管理方式主要是以紙質(zhì)文檔為主，而互聯(lián)網(wǎng)出現(xiàn)之后，數(shù)據(jù)主要以文件的形式存儲。

但做過技術(shù)的人都知道，文件存儲是一個費時又費力的東西；因此，這時一項偉大的發(fā)明出現(xiàn)了——那就是數(shù)據(jù)庫系統(tǒng)。

剛開始的數(shù)據(jù)庫系統(tǒng)是按照二維關(guān)系結(jié)構(gòu)構(gòu)建的關(guān)系數(shù)據(jù)庫系統(tǒng)，到現(xiàn)在也在大量的使用，比如常見的mysql和oracle等。

使用數(shù)據(jù)庫的好處是什么？

好處就是速度快，數(shù)據(jù)一目了然，操作簡單方便。

而隨著技術(shù)的發(fā)展，不但數(shù)據(jù)量越來越多，數(shù)據(jù)形式和格式也越來越復(fù)雜，特別是非結(jié)構(gòu)化數(shù)據(jù)的爆發(fā)式增長；因此，非結(jié)構(gòu)化數(shù)據(jù)的存儲需求越來越大，而且也出現(xiàn)了很多非結(jié)構(gòu)化數(shù)據(jù)存儲中間件，比如mongodb和redis等。

從檢索增強——RAG看檢索技術(shù)的發(fā)展-AI.x社區(qū)

而數(shù)據(jù)存儲是一方面，數(shù)據(jù)的檢索也是一方面；關(guān)系型數(shù)據(jù)庫的好處是一目了然，存儲也方便，但關(guān)系型數(shù)據(jù)庫的數(shù)據(jù)檢索就沒有想象中的那么強大了。關(guān)系型數(shù)據(jù)庫只能進(jìn)行一些簡單的字符匹配或模糊查詢，一旦涉及到復(fù)雜查詢就無能為力了。

而這時搜索中間件就出現(xiàn)了，比如ES——ElasticSearch，它就是嵌入了分詞的功能，根據(jù)某種算法實現(xiàn)完整語句的拆分，使得搜索能力相比傳統(tǒng)關(guān)系型數(shù)據(jù)庫大大增強。

但同樣的是，ES的搜索能力依然有限，它們只能依靠純粹的字符匹配進(jìn)行檢索；比如說讓你去圖書館找本書，不懂的人只能按照書名去找，而懂的人就可以找到類似的。

而且面對現(xiàn)實世界中復(fù)雜的各種關(guān)系，簡單的字符匹配顯然無法滿足我們的需求；因此，一種基于語義查詢的方式就出現(xiàn)了。

從檢索增強——RAG看檢索技術(shù)的發(fā)展-AI.x社區(qū)

什么是語義查詢？

比如說，我說幫我搜索一下孫悟空；這時傳統(tǒng)的搜索方式只能搜索到與孫悟空三個字相關(guān)的內(nèi)容；而與齊天大圣，猴哥，弼馬溫相關(guān)的數(shù)據(jù)就無法準(zhǔn)確查詢了。

而有了語義分析的功能之后，就知道孫悟空，齊天大圣，弼馬溫，大師兄等等是一個人，這時就可以把與此相關(guān)的內(nèi)容全部查詢出來，而這就是RAG需要干的事情。

這也是為什么說，大模型知識庫的重點是不是模型，也不是知識庫，而是數(shù)據(jù)的精確檢索。大模型知識庫的好壞，是由檢索能力所決定的，而不是由大模型決定的。

這也是在昨天關(guān)于RAG技術(shù)的文章中所說的，怎么提升數(shù)據(jù)的召回質(zhì)量，召回數(shù)據(jù)的質(zhì)量越高，大模型的生成效果就越好。

嵌入模型的語義分析能力越強，轉(zhuǎn)化的向量數(shù)據(jù)效果越好，最終檢索到的數(shù)據(jù)質(zhì)量也就越高。

本文轉(zhuǎn)載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/t4vj028hHI2_lRZ65d9SfQ??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

最新RAG綜述來了！北京大學(xué)發(fā)布AIGC的檢索增強技術(shù)綜述

zhangyannni ? 5103瀏覽 ? 0回復(fù)
通過檢索增強生成(RAG) 增強LLM的實戰(zhàn)演練

51CTO內(nèi)容精選 ? 5269瀏覽 ? 0回復(fù)
萬文長文搞定檢索增強生成(RAG)技術(shù)——13篇熱門RAG文章解讀

angel ? 1.6w瀏覽 ? 0回復(fù)
面向大語言模型的檢索增強生成(RAG)技術(shù)：綜述

angel ? 6849瀏覽 ? 0回復(fù)
15種先進(jìn)的檢索增強生成（RAG）技術(shù)

玄姐聊AGI ? 3793瀏覽 ? 0回復(fù)
RAG高級優(yōu)化：基于問題生成的文檔檢索增強

恰似驚鴻 ? 4355瀏覽 ? 0回復(fù)
大模型檢索增強(RAG)技術(shù)之——GraphRAG，知識庫產(chǎn)品必不可少的技術(shù)

AI探索時代 ? 3989瀏覽 ? 0回復(fù)
15種先進(jìn)的檢索增強生成（RAG）技術(shù)

Halo咯咯 ? 3608瀏覽 ? 0回復(fù)
再談大模型檢索增強生成——RAG

AI探索時代 ? 3173瀏覽 ? 0回復(fù)
OPEN-RAG：利用開源大模型增強檢索增強推理

大模型自然語言處理 ? 3744瀏覽 ? 0回復(fù)
基于Agent的金融問答系統(tǒng)：RAG的檢索增強之ElasticSearch

一起AI技術(shù) ? 4649瀏覽 ? 0回復(fù)
怎么解決大模型知識庫的檢索問題，RAG檢索增強之ReRank(重新排序)

AI探索時代 ? 5018瀏覽 ? 0回復(fù)
RAG檢索增強生成和大模型微調(diào)的抉擇

AI探索時代 ? 3541瀏覽 ? 0回復(fù)
九種不同類型的檢索增強生成 (RAG)

Halo咯咯 ? 4343瀏覽 ? 0回復(fù)
什么是檢索增強生成 (RAG)？

Halo咯咯 ? 3653瀏覽 ? 0回復(fù)
探索智能代理增強檢索生成（Agentic RAG）：從基礎(chǔ)到實踐

Halo咯咯 ? 3794瀏覽 ? 0回復(fù)
18種RAG技術(shù)大比拼：誰才是檢索增強生成的最佳選擇？

Halo咯咯 ? 4384瀏覽 ? 0回復(fù)
RAG只能應(yīng)用于文本檢索嗎？關(guān)于大模型應(yīng)用之RAG——檢索增強的思考

AI探索時代 ? 2489瀏覽 ? 0回復(fù)
RAG：7個檢索增強生成技術(shù)的解析（含實現(xiàn)代碼）

Halo咯咯 ? 8075瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

讓AI像人一樣動手！大模型是怎么學(xué)會使用工具的？ 2天前發(fā)布
大模型應(yīng)用技術(shù)是一項重實操輕理論的技術(shù) 3天前發(fā)布

熱門推薦

關(guān)于RAG系統(tǒng)在多輪對話中的問題改寫(優(yōu)化)方法—使用歷史記錄改寫問題 0回復(fù)

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

Deepseek發(fā)布最新OCR模型在實測中展現(xiàn)出驚人效率，僅用15秒便將百頁PDF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對比，你的選擇是？ 0回復(fù)

DeepSeek 成長史：從量化投資到 AI 革命的一個 “非主流” 量化大佬的 AI 夢 0回復(fù)

上一篇：不要上來就大模型，從訓(xùn)練一個小模型開始

下一篇：關(guān)于大模型在企業(yè)生產(chǎn)環(huán)境中的獨立部署問題

社區(qū)精華內(nèi)容

目錄

<tr id="qgqrx"><center id="qgqrx"></center></tr>

<abbr id="qgqrx"><thead id="qgqrx"><tbody id="qgqrx"></tbody></thead></abbr>

<wbr id="qgqrx"><menu id="qgqrx"><ol id="qgqrx"></ol></menu></wbr>

<pre id="qgqrx"><button id="qgqrx"></button></pre>