偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略

發(fā)布于 2025-1-7 11:41
瀏覽
0收藏

什么是RAG?

RAG的全稱(chēng)是檢索增強(qiáng)生成(Retrieval-Augmented Generation,簡(jiǎn)稱(chēng)RAG),它結(jié)合了檢索和和生成技術(shù),通過(guò)整合檢索系統(tǒng)和生成模型的優(yōu)勢(shì),來(lái)提升模型生成文本的質(zhì)量和上下文相關(guān)性。這種技術(shù)主要是為了解決生成式模型在面對(duì)需要具體、實(shí)時(shí)或領(lǐng)域?qū)I(yè)知識(shí)時(shí)可能產(chǎn)生的準(zhǔn)確性不足和上下文不敏感的問(wèn)題。

即它先根據(jù)外部知識(shí)庫(kù)搜索到的信息來(lái)作為上下文,再來(lái)輔助模型回答問(wèn)題,使得模型的回答更準(zhǔn)確。

比如你想做一個(gè)智能助手,當(dāng)用戶(hù)提出一個(gè)問(wèn)題時(shí),需要在你給的知識(shí)庫(kù)里面先搜索出文檔片段,然后再把文檔片段和用戶(hù)問(wèn)題一起丟給大模型,讓模型去回答問(wèn)題,這樣的話模型就可以回答的更有針對(duì)性和準(zhǔn)確性。這一定程度上可以解決大模型幻覺(jué)的問(wèn)題。在之前的文章介紹過(guò)用RAG的技術(shù)來(lái)做智能問(wèn)答  使用Dify 構(gòu)建國(guó)土空間規(guī)劃智能問(wèn)答應(yīng)用 

標(biāo)準(zhǔn)RAG流程主要由三部分組成:

索引(向量嵌入),通過(guò)嵌入模型實(shí)現(xiàn)文本塊的向量編碼,寫(xiě)入向量數(shù)據(jù)庫(kù)。

檢索(相似查詢(xún)),通過(guò)嵌入模型服務(wù)實(shí)現(xiàn)問(wèn)題查詢(xún)的向量編碼,使用相似性查詢(xún)檢索到相關(guān)片段。

生成,將檢索到的片段結(jié)果作為上下文和問(wèn)題一起提交給大模型處理。

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

我這次碰到的兩個(gè)問(wèn)題是在向量嵌入之前,一是對(duì)PDF掃描件的處理,二是文本分段。

1.PDF掃描件處理問(wèn)題

還是先拿dify知識(shí)庫(kù)來(lái)測(cè)試給大家看看

這是原文件,是一個(gè)掃描件

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

上傳到dify,發(fā)現(xiàn)文本分段環(huán)節(jié)分不出來(lái)段落,失敗了,不支持PDF掃描件。

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

于是對(duì)比測(cè)試下別的平臺(tái)

打開(kāi)阿里云百煉,發(fā)現(xiàn)是可以正常分段的。

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

試試 RAGFlow,也是可以的。

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

這兩家知識(shí)庫(kù)系統(tǒng)都預(yù)置了OCR的功能,先用OCR做了提取處理,再執(zhí)行分段、嵌入的過(guò)程。

上周階躍星辰開(kāi)源了他們的OCR產(chǎn)品:GOT-OCR2_0,我們可以來(lái)試試,還是剛剛的文件,轉(zhuǎn)成圖片格式上傳。效果如下~

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

在政府或者企業(yè)內(nèi)部落地智能問(wèn)答場(chǎng)景時(shí),存在大量的PDF掃描件,當(dāng)然我們可以先對(duì)掃描件做轉(zhuǎn)換處理,再上傳到知識(shí)庫(kù)中。但如果知識(shí)庫(kù)預(yù)置OCR功能,在上傳掃描件時(shí)可以直接進(jìn)行處理,還是蠻實(shí)用的一個(gè)功能。

2.文本分段問(wèn)題

事情的起因?yàn)槟秤脩?hù)在使用我們的智能問(wèn)答產(chǎn)品時(shí),問(wèn)了一個(gè)問(wèn)題

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

下面是我們助手的回答

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

下圖是正確的答案,可以看出明顯回答得不正確。

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

于是去dify知識(shí)庫(kù)排查,發(fā)現(xiàn)知識(shí)庫(kù)中是有這個(gè)文件的,但就是問(wèn)不出來(lái)。根據(jù)前面RAG的流程,猜測(cè)可能是分段導(dǎo)致的問(wèn)題,一看果然是因?yàn)橹吧蟼髟撐募街R(shí)庫(kù),是機(jī)械的按照字?jǐn)?shù)進(jìn)行的分段,從而導(dǎo)致沒(méi)有召回相關(guān)的片段。

當(dāng)然dify是提供了自定義選項(xiàng)的,但分段標(biāo)識(shí)符還挺難設(shè)置的,常見(jiàn)的可能設(shè)置成句號(hào)、問(wèn)號(hào)、感嘆號(hào)啥的,但文檔的自然分段多種多樣,如使用數(shù)字標(biāo)識(shí)段落

  1. 段落一
  2. 段落二

使用章節(jié)標(biāo)識(shí)符

  • 第1章:標(biāo)題
  • 1.1 子標(biāo)題
  • 1.1.1 段落

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

于是去扣子上搭建一個(gè)智能問(wèn)答應(yīng)用來(lái)做對(duì)比測(cè)試。

先創(chuàng)建知識(shí)庫(kù),上傳基本農(nóng)田政策文件《自然資源部關(guān)于做好占用永久基本農(nóng)田重大建設(shè)項(xiàng)目用地預(yù)審的通知》,可以看到扣子知識(shí)庫(kù)對(duì)上傳的文件做了比較好的分段,即按照段落進(jìn)行分段,更符合原文的意思,不會(huì)把一個(gè)段落內(nèi)容機(jī)械的按照字?jǐn)?shù)分割成不同的段落,從而造成檢索時(shí)檢索不全或者檢索不到的問(wèn)題。

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

回答效果還可以。

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

阿里云百煉平臺(tái)對(duì)文檔切分提供智能切分和自定義切分兩種方式

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

智能切分對(duì)文本分段的效果是非常好的,基本上實(shí)現(xiàn)了按原文段落進(jìn)行分段。

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

百度千帆大模型平臺(tái):

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

罷了罷了,操作還是這么復(fù)雜,體驗(yàn)還是這么糟糕,還是熟悉的百度。

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

 RAGFlow:

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

QAnything:

沒(méi)把分塊展示出來(lái),上傳文件以后直接提問(wèn)

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

回答的內(nèi)容重復(fù)了

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

測(cè)試對(duì)比了dify、扣子、阿里云百煉、百度千帆、RAGFlow、QAnything等知識(shí)庫(kù)產(chǎn)品,有開(kāi)源的、有商業(yè),有大廠的,有小廠的,總的來(lái)說(shuō)阿里云百煉對(duì)分段處理得最好。

dify知識(shí)庫(kù)一些功能還是做得不錯(cuò)的,比如引入混合檢索和重排序,要是引入OCR和智能分段,那就更好了。

最近Anthropic分享RAG最佳實(shí)踐,提到了一種新的文檔分塊的方式,因?yàn)閭鹘y(tǒng)的RAG系統(tǒng)有一個(gè)顯著的限制:它們經(jīng)常破壞上下文,就算是智能分段,有些信息還是需要結(jié)合上下文來(lái)理解才更準(zhǔn)確。

現(xiàn)在通過(guò)在嵌入之前將塊特定的解釋性上下文附加到每個(gè)塊之前(“上下文嵌入”)和創(chuàng)建BM25索引(“上下文BM25”)來(lái)解決這個(gè)問(wèn)題,再結(jié)合重排序來(lái)降低檢索的失敗率。大家有興趣可以看看他們的實(shí)驗(yàn)。

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

標(biāo)準(zhǔn)RAG流程

RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略-AI.x社區(qū)

上下文嵌入+BM25索引+重排序

小結(jié):在使用RAG技術(shù)落地智能問(wèn)答助手過(guò)程中,不管是使用開(kāi)源、商業(yè)平臺(tái)、還是自研,引入OCR的能力和智能分段都是重要和實(shí)用的功能。

參考資料:

引入混合檢索(Hybrid Search)和重排序(Rerank)改進(jìn) RAG 系統(tǒng)召回效果

Anthropic分享RAG最佳實(shí)踐:Contextual Retrieval!

登頂Hugging Face總榜,創(chuàng)始人Clem點(diǎn)贊轉(zhuǎn)發(fā),OCR-2.0火了!

本文轉(zhuǎn)載自 ??AI 思與行??,作者: fxcc

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦