偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<menuitem id="kd6dr"><pre id="kd6dr"></pre></menuitem>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠(chǎng)商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線(xiàn)學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專(zhuān)業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線(xiàn)教育平臺(tái)

RAG 企業(yè)級(jí)應(yīng)用落地框架細(xì)節(jié)差異對(duì)比原創(chuàng)

發(fā)布于 2024-7-24 13:14

瀏覽

0收藏

1、什么是 RAG ？

RAG 檢索增強(qiáng)生成本質(zhì)上來(lái)講，就三件事情：

RAG 企業(yè)級(jí)應(yīng)用落地框架細(xì)節(jié)差異對(duì)比 -AI.x社區(qū)

第一、Indexing 索引。即如何更有效地存儲(chǔ)知識(shí)。

第二、Retrieval 檢索。即在龐大的知識(shí)庫(kù)中，如何篩選出少量的有益知識(shí)，供大模型參考。

第三、Generation 生成。即如何將用戶(hù)的提問(wèn)與檢索到的知識(shí)相結(jié)合，使得大模型能夠生成有價(jià)值的回答。

這三個(gè)步驟表面上看似乎并不復(fù)雜，然而在 RAG 從構(gòu)建到實(shí)際部署的整個(gè)流程中，包含了眾多精細(xì)且復(fù)雜的工作環(huán)節(jié)，這些落地細(xì)節(jié)是最具挑戰(zhàn)的工作。

RAG 企業(yè)級(jí)應(yīng)用落地框架細(xì)節(jié)差異對(duì)比 -AI.x社區(qū)

雖然 RAG 架構(gòu)基本上是按照這些模塊來(lái)設(shè)計(jì)的，但不同的實(shí)施方案在具體落地時(shí)各有其獨(dú)特之處。

下面詳細(xì)對(duì)比剖析。

2、RAG 開(kāi)源框架架構(gòu)對(duì)比

第一、網(wǎng)易 QAnything

網(wǎng)易 QAnything 的亮點(diǎn)在于 Rerank 模塊。

RAG 企業(yè)級(jí)應(yīng)用落地框架細(xì)節(jié)差異對(duì)比 -AI.x社區(qū)

第二、RAGFlow

RAGFlow 的亮點(diǎn)在于數(shù)據(jù)處理模塊和知識(shí)索引構(gòu)建模塊。

RAG 企業(yè)級(jí)應(yīng)用落地框架細(xì)節(jié)差異對(duì)比 -AI.x社區(qū)

第三、智譜 RAG

智譜 RAG 的亮點(diǎn)在于文檔解析、切片、Query 改寫(xiě)及 Recall 模型的微調(diào)。

RAG 企業(yè)級(jí)應(yīng)用落地框架細(xì)節(jié)差異對(duì)比 -AI.x社區(qū)

第四、FastGPT

FastGPT 的優(yōu)點(diǎn)是模塊動(dòng)態(tài)配置靈活。

RAG 企業(yè)級(jí)應(yīng)用落地框架細(xì)節(jié)差異對(duì)比 -AI.x社區(qū)

3、開(kāi)源 RAG 框架的各個(gè)模塊對(duì)比

第一、知識(shí)處理模塊

QAnything的此模塊使用了 PDF 文件解析，具體是通過(guò) PyMuPDF 庫(kù)來(lái)完成的，該庫(kù)是目前效率最高的解析工具。在解析文檔內(nèi)容時(shí)，無(wú)論是文本文件還是圖像文件，均使用 PyMuPDF 的 get_text 方法。需要注意的是，如果圖像文件中不包含文字，使用此方法時(shí)將會(huì)出現(xiàn)錯(cuò)誤。
RAGFlow 的此模塊使用 OCR 和文檔布局分析等功能，在標(biāo)準(zhǔn)的 RAG（檢索增強(qiáng)生成）系統(tǒng)中通常被歸為一個(gè)不太顯眼的非結(jié)構(gòu)化數(shù)據(jù)加載器部分。據(jù)此推測(cè)，RagFlow 的一個(gè)關(guān)鍵優(yōu)勢(shì)很可能在于其文件解析的能力。
智譜 RAG--：
FastGPT--：

第二、召回模塊

QAnything 向量庫(kù)使用了 Milvus 的混合檢索策略（結(jié)合 BM25 全文檢索和向量檢索），在檢索過(guò)程中不設(shè)定任何閾值，直接返回前 100 個(gè)最相關(guān)的結(jié)果（TopK =100）。
RAGFlow 向量數(shù)據(jù)庫(kù)選用了 ElasticSearch 進(jìn)行操作。它實(shí)現(xiàn)了文本檢索與向量檢索的混合模式，盡管未明確指定所用的向量模型，但在文本檢索方面，使用了 “huqie” 作為分詞工具。
智譜 RAG混合檢索結(jié)合語(yǔ)義和全文檢索，利用 BGE-M3 向量模型，不直接通過(guò)向量或文本檢索召回?cái)?shù)據(jù)，而是使用 RFF 算法進(jìn)行排序。
FastGPT文章結(jié)構(gòu)切片和遞增索引策略有效解決了問(wèn)題。四種數(shù)據(jù)構(gòu)建方案表現(xiàn)佳：

查詢(xún)對(duì)原文：直接召回知識(shí)片段。
查詢(xún)對(duì)查詢(xún)：便于維護(hù)，自動(dòng)提取查詢(xún)。
查詢(xún)對(duì)摘要：建立摘要與片段映射。
偽答案對(duì)原文：生成偽答案召回片段。

并對(duì) Embedding 模型進(jìn)行微調(diào)。

第三、Rerank 模塊

QAnything 精確排序使用自定義的 Rerank 模型，閾值設(shè)定為 0.35。
RAGFlow 重排排序結(jié)合了文本匹配得分和向量匹配得分，其中文本匹配的默認(rèn)權(quán)重為 0.3，向量匹配的權(quán)重為 0.7。
智譜 RAG支持重排功能，可動(dòng)態(tài)調(diào)整設(shè)置；整合嵌入向量（Embedding）與全文搜索（FullText）的結(jié)果，并按 ID 進(jìn)行去重處理；對(duì)問(wèn)答（QA）字符串進(jìn)行拼接，移除其中的空格和標(biāo)點(diǎn)符號(hào)，并對(duì)處理后的字符串進(jìn)行哈希編碼以實(shí)現(xiàn)去重；若已配置重排序（Rerank）模型，則調(diào)用該模型對(duì)結(jié)果進(jìn)行重新排序，并在評(píng)分（Score）中新增重排序得分；若未配置，則評(píng)分中不會(huì)包含重排序得分。
?FastGPT--：

第四、大模型處理模塊

QAnything 將所有數(shù)據(jù)集合并至一個(gè)提示詞（Prompt），并對(duì)最大 token 長(zhǎng)度進(jìn)行了優(yōu)化處理。
RAGFlow 對(duì)大模型可處理的 token 數(shù)量進(jìn)行限制篩選。
智譜 RAG--。
?FastGPT在模型微調(diào)過(guò)程中，我們采取了分步驟的策略：起初使用公開(kāi)可用的通用問(wèn)答數(shù)據(jù)集進(jìn)行初步微調(diào)，隨后利用特定領(lǐng)域的問(wèn)答數(shù)據(jù)進(jìn)行進(jìn)一步微調(diào)，最終使用經(jīng)過(guò)人工精確標(biāo)注的高質(zhì)量問(wèn)答數(shù)據(jù)來(lái)進(jìn)行細(xì)致的微調(diào)。

第五、Web 服務(wù)模塊

QAnything 利用 Sanic 框架搭建 Web 服務(wù)。
RAGFlow 基于 Flask 構(gòu)建 Web 服務(wù)。
智譜 RAG--。
?FastGPT--。

第六、切詞處理模塊

QAnything 利用自定義的 ChineseTextSplitter 完成。
RAGFlow 基于 huqie 完成。
智譜 RAG--。
?FastGPT--。

第七、文件存儲(chǔ)模塊

QAnything --。
RAGFlow MinIO 被選用于文件存儲(chǔ)解決方案。。
智譜 RAG--。
?FastGPT--。

4、RAG 框架總結(jié)

1、Qanything 的 Rerank 模塊設(shè)計(jì)極為出色。

2、RAGFlow 在文檔處理方面表現(xiàn)卓越。

3、FastGPT 模塊具備豐富的動(dòng)態(tài)配置選項(xiàng)。

4、智譜 RAG 在特定領(lǐng)域數(shù)據(jù)的微調(diào)訓(xùn)練上表現(xiàn)最佳。

然而，一切脫離業(yè)務(wù)場(chǎng)景談架構(gòu)都是耍流氓，結(jié)合具體業(yè)務(wù)場(chǎng)景考慮下，并不存在絕對(duì)的“最好”。在各自的業(yè)務(wù)場(chǎng)景應(yīng)用中，能夠成功實(shí)施并產(chǎn)生效果的就是最佳選擇。實(shí)踐落地才是關(guān)鍵，落地成效為王道！

本文轉(zhuǎn)載自公眾號(hào)玄姐聊AGI 作者：玄姐

原文鏈接：??https://mp.weixin.qq.com/s/HoQ0Ex9yuxrBp0aW6kuWcQ??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

“企業(yè)級(jí)AI元年”已至，AI如何更好賦能企業(yè)發(fā)展？

liutao988 ? 4262瀏覽 ? 0回復(fù)
企業(yè)級(jí)智能知識(shí)庫(kù)搜索問(wèn)答技術(shù)與應(yīng)用

51CTO技術(shù)棧 ? 3808瀏覽 ? 0回復(fù)
#AIGC創(chuàng)新先鋒者征文大賽#企業(yè)級(jí)智能知識(shí)庫(kù)搜索問(wèn)答技術(shù)與應(yīng)用

瀾舟科技 ? 3407瀏覽 ? 0回復(fù)
關(guān)于大模型在企業(yè)級(jí)應(yīng)用中的選擇問(wèn)題疑問(wèn)回復(fù)

AI探索時(shí)代 ? 2961瀏覽 ? 0回復(fù)
微軟、IDC聯(lián)合發(fā)布：企業(yè)級(jí)生成式AI，五大應(yīng)用趨勢(shì)

Aceryt ? 3416瀏覽 ? 0回復(fù)
企業(yè)級(jí)RAG全解析：實(shí)現(xiàn)精準(zhǔn)、安全、高效智能客服

云原生AI百寶箱 ? 3215瀏覽 ? 0回復(fù)
構(gòu)建大模型 Agent 應(yīng)用六個(gè)框架對(duì)比剖析

玄姐聊AGI ? 5008瀏覽 ? 0回復(fù)
在企業(yè)場(chǎng)景中應(yīng)該怎么部署大模型——大模型企業(yè)級(jí)部署框架介紹

AI探索時(shí)代 ? 4412瀏覽 ? 0回復(fù)
企業(yè)級(jí)RAG如何實(shí)現(xiàn)權(quán)限控制？Dify 1.1.0 新版本元數(shù)據(jù)保姆級(jí)教程！

AI博物院 ? 6652瀏覽 ? 0回復(fù)
五大企業(yè)級(jí)智能體的剛需落地應(yīng)用場(chǎng)景

九歌AI大模型 ? 3194瀏覽 ? 0回復(fù)
AI 智能體架構(gòu)企業(yè)級(jí)落地的工程化能力設(shè)計(jì)

玄姐聊AGI ? 2221瀏覽 ? 0回復(fù)
關(guān)于RAG檢索增強(qiáng)的右側(cè)優(yōu)化方案——企業(yè)級(jí)應(yīng)用中怎么提升RAG的檢索準(zhǔn)確度

AI探索時(shí)代 ? 1455瀏覽 ? 0回復(fù)
企業(yè)級(jí) MCP + A2A 整合架構(gòu)設(shè)計(jì)與落地案例實(shí)現(xiàn)

玄姐聊AGI ? 2461瀏覽 ? 0回復(fù)
Seedream 4.0 實(shí)測(cè)：一致性媲美Nano Banana，附企業(yè)級(jí)應(yīng)用案例

NLP工作站 ? 8553瀏覽 ? 0回復(fù)
萬(wàn)字剖析 Shopify 落地多 Agent 的企業(yè)級(jí)實(shí)戰(zhàn)經(jīng)驗(yàn)

玄姐聊AGI ? 2121瀏覽 ? 0回復(fù)
基于 AI 中間件構(gòu)建企業(yè)級(jí) AI 應(yīng)用架構(gòu)設(shè)計(jì)

玄姐聊AGI ? 1600瀏覽 ? 0回復(fù)
企業(yè)級(jí)多 AI 智能體產(chǎn)業(yè)落地，從場(chǎng)景試點(diǎn)到規(guī)?；?em>應(yīng)用實(shí)踐架構(gòu)設(shè)計(jì)

玄姐聊AGI ? 2608瀏覽 ? 0回復(fù)
萬(wàn)字長(zhǎng)文剖析企業(yè)級(jí)多智能體案例架構(gòu)設(shè)計(jì)與代碼級(jí)落地實(shí)踐

玄姐聊AGI ? 1149瀏覽 ? 0回復(fù)
企業(yè)級(jí) AI Test 測(cè)試平臺(tái)架構(gòu)設(shè)計(jì)與落地實(shí)踐

玄姐聊AGI ? 2805瀏覽 ? 0回復(fù)

這個(gè)用戶(hù)很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門(mén)推薦

阿里新一代企業(yè)級(jí)多 AI 智能體開(kāi)發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

深度拆解 AI 原生應(yīng)用架構(gòu)設(shè)計(jì)：11 大核心要素 + 落地路徑全解析 0回復(fù)

AI 智能體在順豐運(yùn)營(yíng)場(chǎng)景的落地案例剖析 0回復(fù)

企業(yè)級(jí) AI Test 測(cè)試平臺(tái)架構(gòu)設(shè)計(jì)與落地實(shí)踐 0回復(fù)

以 Dify 架構(gòu)為例，吃透 AI 原生應(yīng)用開(kāi)發(fā)平臺(tái)的設(shè)計(jì)精髓 0回復(fù)

上一篇： GraphRAG + Ollama 本地部署全攻略：避坑實(shí)戰(zhàn)指南

下一篇：最強(qiáng)大模型 Llama 3.1-405B 架構(gòu)設(shè)計(jì)剖析

社區(qū)精華內(nèi)容

目錄

<abbr id="re6ly"><form id="re6ly"></form></abbr>

<cite id="re6ly"><strike id="re6ly"></strike></cite>

<table id="re6ly"><strong id="re6ly"><td id="re6ly"></td></strong></table>

<tt id="re6ly"></tt>

<nav id="re6ly"><thead id="re6ly"></thead></nav>

<blockquote id="re6ly"><ul id="re6ly"></ul></blockquote>

<table id="re6ly"><optgroup id="re6ly"></optgroup></table>