偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<tt id="a9vvs"></tt>

<del id="a9vvs"></del>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

Adaptive-RAG：性能提升50%以上的高效RAG策略

大語言模型論文跟蹤

發(fā)布于 2024-10-17 16:04

瀏覽

0收藏

Adaptive-RAG：性能提升50%以上的高效RAG策略-AI.x社區(qū) 圖片

框架

自適應(yīng)RAG通過判斷問題的復(fù)雜性來自動選擇使用哪種RAG策略。作者將問題劃分為三類（如上圖的C部分）：

? 開放領(lǐng)域問答：這類任務(wù)通常涉及兩個模塊：一個檢索器和一個閱讀器。隨著具有千億參數(shù)的超強推理能力的LLMs的出現(xiàn)，LLMs和檢索器之間的協(xié)同作用已經(jīng)取得了顯著進(jìn)展。然而，盡管在單跳檢索增強LLMs方面取得了進(jìn)展，但某些查詢的復(fù)雜性需要更復(fù)雜的策略。

? 多跳問答：多跳問答（Multi-hop QA）是傳統(tǒng)開放領(lǐng)域問答（Open-domain QA）的擴(kuò)展，需要系統(tǒng)全面收集和上下文化多個文檔的信息回答更復(fù)雜的查詢。首先將多跳查詢分解為更簡單的單跳查詢，反復(fù)訪問LLMs和檢索器來解決這些子查詢，并合并它們的解決方案以形成完整答案。這種查詢的缺點是：每個查詢進(jìn)行迭代訪問LLMs和檢索器可能效率極低，因為有些查詢可能足夠簡單，可以通過單一檢索步驟甚至僅通過LLM本身來解決。

? 自適應(yīng)檢索：為了處理不同復(fù)雜性的查詢，自適應(yīng)檢索策略根據(jù)每個查詢的復(fù)雜性動態(tài)決定是否檢索文檔。根據(jù)實體的頻率來確定查詢的復(fù)雜性級別，并建議僅當(dāng)頻率低于一定閾值時才使用檢索模塊。然而，這種方法僅關(guān)注于檢索與否的二元決策，可能不足以解決需要多個推理步驟的更復(fù)雜的查詢。

分別使用三種策略來運用RAG進(jìn)行回答：

Adaptive Retrieval-Augmented Generation (Adaptive-RAG) 是一種新型的問答框架，它能夠根據(jù)問題的復(fù)雜性動態(tài)選擇最適合的策略來處理檢索增強的大型語言模型（LLMs）。這三種策略包括：

1. 非檢索方法（No Retrieval）：這是最簡單的策略，直接使用大型語言模型（LLM）本身的知識庫來生成答案。這種方法適用于那些模型已經(jīng)知道答案的簡單問題，不需要額外的外部信息。

2. 單步檢索方法（Single-step Approach）：當(dāng)問題需要額外的信息時，這種方法會先從外部知識源檢索相關(guān)信息，然后將檢索到的文檔作為上下文信息輸入到LLM中，幫助模型生成更準(zhǔn)確的答案。這種方法適用于需要一次額外信息檢索的中等復(fù)雜度問題。

3. 多步檢索方法（Multi-step Approach）：對于最復(fù)雜的問題，需要從多個文檔中綜合信息并進(jìn)行多步推理。這種方法通過迭代地訪問檢索器和LLM，逐步構(gòu)建起解決問題所需的信息鏈。這種方法適用于需要多步邏輯推理的復(fù)雜問題。

Adaptive-RAG的核心在于它能夠通過一個分類器來評估問題的復(fù)雜性，然后根據(jù)這個評估結(jié)果選擇最合適的處理策略。分類器是一個較小的語言模型，它被訓(xùn)練來預(yù)測傳入問題（query）的復(fù)雜性級別，并自動收集標(biāo)簽，這些標(biāo)簽來自于模型預(yù)測的實際結(jié)果和數(shù)據(jù)集中固有的歸納偏差。

通過這種方式，Adaptive-RAG能夠靈活地在不同的檢索增強LLM策略之間進(jìn)行切換，從而在處理各種復(fù)雜性的問題時，實現(xiàn)更高的效率和準(zhǔn)確性。這種方法在實驗中顯示出，與現(xiàn)有的自適應(yīng)檢索方法相比，Adaptive-RAG在多個開放域問答數(shù)據(jù)集上都取得了更好的整體效率和準(zhǔn)確性。

在Adaptive-RAG模型中，訓(xùn)練分類器以準(zhǔn)確評估問題的復(fù)雜性是一個關(guān)鍵步驟。這個過程涉及以下幾個關(guān)鍵步驟：

1. 定義復(fù)雜性標(biāo)簽：首先，需要定義問題的復(fù)雜性等級。在Adaptive-RAG中，通常有三個類別：簡單（A）、中等（B）和復(fù)雜（C）。簡單問題可以直接由LLM回答，中等復(fù)雜度問題需要單步檢索，而復(fù)雜問題則需要多步檢索和推理。

2. 自動收集訓(xùn)練數(shù)據(jù)：由于沒有現(xiàn)成的帶有復(fù)雜性標(biāo)簽的查詢數(shù)據(jù)集，Adaptive-RAG通過兩種策略自動構(gòu)建訓(xùn)練數(shù)據(jù)集：

? 從不同檢索增強LLM策略的預(yù)測結(jié)果中標(biāo)注查詢的復(fù)雜性。
如果非檢索方法能夠正確生成答案，則對應(yīng)問題的標(biāo)簽為簡單（A）；
如果單步檢索方法和多步檢索方法都能正確回答，而非檢索方法失敗，則對應(yīng)問題的標(biāo)簽為中等（B）；
如果只有多步檢索方法能夠正確回答，則對應(yīng)問題的標(biāo)簽為復(fù)雜（C）。

? 利用基準(zhǔn)數(shù)據(jù)集中的固有偏差來標(biāo)注未標(biāo)記的查詢。
例如，如果一個查詢在單步數(shù)據(jù)集中未被標(biāo)記，則自動分配標(biāo)簽為中等（B）；
如果在多步數(shù)據(jù)集中未被標(biāo)記，則自動分配標(biāo)簽為復(fù)雜（C）。

3. 訓(xùn)練分類器：使用自動收集的查詢-復(fù)雜性對數(shù)據(jù)集，訓(xùn)練一個較小的語言模型作為分類器。這個分類器的目標(biāo)是根據(jù)輸入的問題（query）預(yù)測其復(fù)雜性級別。訓(xùn)練過程中，使用交叉熵?fù)p失函數(shù)，并選擇在驗證集上表現(xiàn)最佳的迭代次數(shù)。

4. 評估和優(yōu)化分類器：在訓(xùn)練完成后，評估分類器的性能，包括準(zhǔn)確率和其他相關(guān)指標(biāo)。如果分類器的性能不足，可能需要進(jìn)一步優(yōu)化，例如通過調(diào)整模型結(jié)構(gòu)、增加訓(xùn)練數(shù)據(jù)或改進(jìn)數(shù)據(jù)標(biāo)注策略。

5. 集成到Adaptive-RAG框架：將訓(xùn)練好的分類器集成到Adaptive-RAG框架中。在推理階段，分類器用于預(yù)測新問題的復(fù)雜性，然后根據(jù)這個預(yù)測結(jié)果選擇最合適的問答策略。

通過這種方法，Adaptive-RAG能夠動態(tài)地調(diào)整其查詢處理策略，以適應(yīng)不同復(fù)雜性的問題，從而提高問答系統(tǒng)的整體效率和準(zhǔn)確性。

性能

Adaptive-RAG：性能提升50%以上的高效RAG策略-AI.x社區(qū) 圖片

上圖展示了不同檢索增強生成方法在問答任務(wù)中的性能和效率對比。這些方法包括不使用檢索的單步方法、自適應(yīng)檢索方法、多步方法，以及本文提出的Adaptive-RAG方法。圖中的橫軸表示每個查詢的處理時間，縱軸表示問答任務(wù)的性能，通常使用F1分?jǐn)?shù)（F1 Score）來衡量。

從圖中可以看出，Adaptive-RAG方法在處理各種復(fù)雜性的查詢時，能夠在保持較高F1分?jǐn)?shù)的同時，減少每個查詢的處理時間。這意味著Adaptive-RAG方法在提高問答系統(tǒng)整體效率的同時，也增強了系統(tǒng)的準(zhǔn)確性。

具體來說，不使用檢索的單步方法（No Retrieval）在處理簡單查詢時效率較高，但在處理復(fù)雜查詢時性能下降。自適應(yīng)檢索方法（Adaptive Retrieval）和多步方法（Multi-step Approach）雖然能夠處理更復(fù)雜的查詢，但它們在效率上有所犧牲，尤其是多步方法，其處理時間顯著增加。

相比之下，Adaptive-RAG方法通過動態(tài)選擇最合適的檢索策略，實現(xiàn)了在簡單和復(fù)雜查詢之間的有效平衡。這表明Adaptive-RAG方法能夠根據(jù)查詢的實際需求，靈活地調(diào)整其處理策略，從而在不同的問答場景中都能取得良好的性能。

Arxiv^[1]

引用鏈接

??[1]?? Arxiv: https://arxiv.org/abs/2403.14403

本文轉(zhuǎn)載自 ??大語言模型論文跟蹤??，作者：HuggingAGI

標(biāo)簽

已于2024-10-17 18:50:34修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

50%性能提升

Crystalcxt ? 4388瀏覽 ? 0回復(fù)
再次提升RAG性能：兩種高效的Rerank模型實踐指南

AIGC觀察者 ? 2.7w瀏覽 ? 0回復(fù)
RAG技術(shù)性能提升之文檔分塊策略方案

AIGC觀察者 ? 6932瀏覽 ? 0回復(fù)
提升RAG系統(tǒng)性能10條策略建議

AIGC觀察者 ? 3903瀏覽 ? 0回復(fù)
突破AI性能瓶頸！揭秘LLaMA-MoE模型的高效神經(jīng)元分配策略

AI論文解讀 ? 4135瀏覽 ? 0回復(fù)
RAPTOR 檢索樹再次進(jìn)一步提升RAG性能的設(shè)計思路

AIGC觀察者 ? 5750瀏覽 ? 0回復(fù)
提升5.69倍，高效RAG上下文壓縮方法COCOM

Aceryt ? 3938瀏覽 ? 0回復(fù)
提升 RAG 系統(tǒng)的回答質(zhì)量：構(gòu)建高效的 Prompt

玄姐聊AGI ? 5346瀏覽 ? 0回復(fù)
KAG：RAG已經(jīng)不夠了，知識增強生成才是王道，提升樸素RAG一倍性能

大語言模型論文跟蹤 ? 1.3w瀏覽 ? 0回復(fù)
如何改進(jìn)RAG模型的性能？

51CTO內(nèi)容精選 ? 3834瀏覽 ? 0回復(fù)
Class-RAG：通過RAG 提高內(nèi)容審核性能

大語言模型論文跟蹤 ? 3610瀏覽 ? 0回復(fù)
TextIn：一款優(yōu)秀的文檔解析神器，提升RAG性能必備

恰似驚鴻 ? 6378瀏覽 ? 0回復(fù)
提升人工智能性能的三種關(guān)鍵的LLM壓縮策略

51CTO內(nèi)容精選 ? 3194瀏覽 ? 0回復(fù)
RAG 應(yīng)用效果不太理想？試試以下RAG優(yōu)化策略大幅提升問答效果

AI博物院 ? 1.1w瀏覽 ? 0回復(fù)
提升RAG性能的全攻略：優(yōu)化檢索增強生成系統(tǒng)的策略大揭秘

Halo咯咯 ? 8605瀏覽 ? 0回復(fù)
提升RAG性能：分塊后，Chunk Enrichment的2個關(guān)鍵優(yōu)化步驟不可錯過

凝固的雨_1 ? 4107瀏覽 ? 0回復(fù)
RAG圈的DeepSeek，中科院DeepRAG讓大模型帶著“思考”檢索，性能提升21.99%

PaperAgent ? 5009瀏覽 ? 0回復(fù)
WebWalker：通過Multi Agent提升RAG在開放域QA的性能

大語言模型論文跟蹤 ? 3296瀏覽 ? 0回復(fù)
ViDoRAG：提升視覺RAG性能10%

大語言模型論文跟蹤 ? 3877瀏覽 ? 0回復(fù)

大語言模型論文跟蹤

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

大模型工具規(guī)劃能力大比拼：MCP-Bench測評全解析 2025-09-12 07:19:43發(fā)布
CodeRAG：AI寫代碼性能飆升40%，比Github Copilot強 2025-08-04 01:08:40發(fā)布

熱門推薦

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

別再怪AI“聽不懂人話”了，90%的返工和錯誤，都錯在你下達(dá)指令的第一句話 0回復(fù)

Deepseek發(fā)布最新OCR模型在實測中展現(xiàn)出驚人效率，僅用15秒便將百頁PDF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對比，你的選擇是？ 0回復(fù)

DeepSeek 成長史：從量化投資到 AI 革命的一個 “非主流” 量化大佬的 AI 夢 0回復(fù)

上一篇：大模型榜單還能信嗎？一個假模型就能登頂排行榜

下一篇： VisRAG：清華大學(xué)&面壁智能提出了一種新的RAG思路，效果提升明顯

社區(qū)精華內(nèi)容

目錄

<pre id="prcv1"><p id="prcv1"></p></pre>