偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

淺看引入智能信息助理提升大模型處理復(fù)雜推理任務(wù)的潛力-AssisTRAG 原創(chuàng)

大模型自然語言處理

發(fā)布于 2024-11-14 15:13

瀏覽

0收藏

AssisTRAG通過集成一個智能信息助手來提升LLMs處理復(fù)雜推理任務(wù)的能力。該框架由兩個主要組件構(gòu)成：一個凍結(jié)的主語言模型和一個可訓(xùn)練的助手語言模型。

淺看引入智能信息助理提升大模型處理復(fù)雜推理任務(wù)的潛力-AssisTRAG-AI.x社區(qū)

AssisTRAG與之前的RAG對比

1. 組件

主語言模型（Main LLM）：負(fù)責(zé)根據(jù)提供的信息生成答案。這個模型是固定的，不進(jìn)行訓(xùn)練。
助手語言模型（Assistant LLM）：負(fù)責(zé)信息管理，包括記憶管理和知識管理。這個模型是可訓(xùn)練的。

可以看出，相比之前的RAG，該框架主要創(chuàng)新點是引入一個Assistant LLM，下面詳細(xì)看下助手語言模型功能。

2. AssisTRAG

淺看引入智能信息助理提升大模型處理復(fù)雜推理任務(wù)的潛力-AssisTRAG-AI.x社區(qū)

AssisTRAG主要分為兩個類別來處理復(fù)雜任務(wù)：記憶管理和知識管理。記憶管理涉及整合和分析來自內(nèi)部內(nèi)存的內(nèi)容，而知識管理則側(cè)重于利用外部知識。這兩個主要功能由AssisTRAG的四個核心能力支持：

工具使用（Tool Usage）：從內(nèi)部記憶和外部知識庫中檢索相關(guān)信息。
動作執(zhí)行（Action Execution）：進(jìn)行推理、分析信息需求并提取知識。
記憶構(gòu)建（Memory Building）：記錄從歷史交互中提取的關(guān)鍵知識和推理模式。
計劃指定（Plan Specification）：確定在答案生成過程中每個步驟的必要性。

2.1 記憶管理

記憶管理模塊通過存儲和檢索歷史交互來提升主語言模型的性能。有效的記憶管理包括兩個主要過程：捕獲新見解和檢索先前存儲的信息。這兩個過程主要有以下三個能力：

1. Action I: 筆記記錄

筆記記錄功能負(fù)責(zé)記錄每個歷史交互中的關(guān)鍵信息和推理模式。具體來說，給定主語言模型的歷史交互（包括問題、參考答案和生成的答案），助手的任務(wù)是將答案背后的關(guān)鍵推理過程記入記憶槽中：

這樣，所有先前問題的記憶槽累積起來形成助手的記憶，用于后續(xù)的記憶檢索。

作用：通過記錄和存儲歷史交互中的關(guān)鍵推理過程，助手能夠在面對類似問題時快速檢索和應(yīng)用這些推理模式，從而提高回答的質(zhì)量和效率。

2. Tool I: 記憶檢索器

記憶檢索器利用助手的記憶，根據(jù)當(dāng)前問題檢索歷史上相關(guān)的記憶。具體來說，記憶檢索器會檢索與當(dāng)前問題相關(guān)的歷史記憶，并將其表示為：

作用：通過從記憶中檢索相關(guān)歷史記憶，助手可以為當(dāng)前問題提供額外的上下文和信息，幫助主語言模型更好地理解和回答問題。

3. Plan I: 評估檢索記憶的有用性

如果問題是全新的，檢索到的記憶可能不僅無助于回答，還可能負(fù)面影響主語言模型的響應(yīng)。因此，助手需要評估檢索到的記憶是否對當(dāng)前問題有幫助。具體來說，助手使用一個提示來評估檢索到的記憶是否有助于回答當(dāng)前問題。只有當(dāng)答案是肯定的時候，檢索到的記憶才會被提供給主語言模型。

實現(xiàn)：通過一個提示，助手評估檢索到的記憶是否對當(dāng)前問題有益。如果評估結(jié)果是肯定的，這些記憶槽將被提供給主語言模型。

作用：這一計劃確保了只有相關(guān)的記憶會被提供給主語言模型，避免了無關(guān)或負(fù)面的記憶干擾回答的質(zhì)量。

2.2 知識管理

知識管理涉及以下四個能力：

1. 動作 II：問題分解

功能：將當(dāng)前問題分解為多個子查詢，以便從不同方面檢索知識。
實現(xiàn)：給定一個問題，動作將其分解為一系列子查詢。例如，問題“音樂家和諷刺作家Allie Goertz寫了一首關(guān)于《辛普森一家》角色Milhouse的歌曲，Matt Groening是根據(jù)誰的名字命名的？”可以被分解為：

子查詢1：Allie Goertz寫了一首關(guān)于《辛普森一家》角色Milhouse的歌曲。
子查詢2：Matt Groening是根據(jù)誰的名字命名了Milhouse？

2. 工具 II：知識檢索器

功能：利用子查詢從外部知識庫中檢索相關(guān)文檔。
實現(xiàn)：使用子查詢，知識檢索器從外部知識庫中檢索相關(guān)文檔，表示為。例如，子查詢1和子查詢2將被用來從維基百科等外部數(shù)據(jù)庫中檢索與Allie Goertz和Milhouse相關(guān)的文檔。

3. 動作 III：知識提取

功能：從檢索到的文檔中提取關(guān)鍵知識。
實現(xiàn)：給定問題和檢索到的文檔，動作負(fù)責(zé)從中提取相關(guān)知識。例如，從檢索到的文檔中提取出：

Allie Goertz 是一位美國音樂家和諷刺作家。
Milhouse 是《辛普森一家》中的一個虛構(gòu)角色，由Matt Groening創(chuàng)造，并以意大利獨裁者Benito Mussolini命名。

4. 計劃 II：評估提取知識的相關(guān)性

功能：確保提供給主語言模型的信息準(zhǔn)確且相關(guān)。
實現(xiàn)：助手通過提示評估提取的知識是否與當(dāng)前問題相關(guān)。只有當(dāng)提取的知識被認(rèn)為對回答問題有幫助時，才會將其提供給主語言模型。

2.3 AssisTRAG 訓(xùn)練

淺看引入智能信息助理提升大模型處理復(fù)雜推理任務(wù)的潛力-AssisTRAG-AI.x社區(qū)

AssisTRAG 的訓(xùn)練過程分為課程助理學(xué)習(xí)和強(qiáng)化偏好優(yōu)化兩個階段。課程學(xué)習(xí)階段通過逐步增加任務(wù)復(fù)雜性來提升助手在 RAG 過程中的技能。強(qiáng)化偏好優(yōu)化階段則通過根據(jù)主 LLM 的反饋調(diào)整助手的輸出，確保助手提供的幫助更加貼合主 LLM 的需求。

2.4 AssisTRAG 推理

AssisTRAG 通過三個步驟啟動其推理過程：

1. 信息檢索與整合

在這個初始階段，AssisTRAG 首先激活 Action II 來理解主 LLM 的信息需求。然后，它使用 Tool I 和 Tool II 分別從內(nèi)部記憶和外部知識庫中檢索相關(guān)信息。接著，它調(diào)用 Action III 從檢索到的文檔中提取關(guān)鍵知識。

2. 決策

在這一階段，AssisTRAG 決定是否將檢索到的記憶和提取的知識提供給主 LLM。它激活 Plan I 和 Plan II 來評估這些檢索到的記憶和知識對當(dāng)前問題的相關(guān)性和有用性。如果助手認(rèn)為這些信息有幫助，它們將被提供給主 LLM 以輔助回答生成。

3. 回答生成與記憶更新

在最后階段，AssisTRAG 提示主 LLM 根據(jù)問題、其內(nèi)部知識和助手提供的信息生成答案。之后，AssisTRAG 激活 Action I，利用其筆記功能，捕捉交互中的關(guān)鍵推理步驟并將其納入其記憶中。這確保了助手的知識庫保持最新。

實驗效果

淺看引入智能信息助理提升大模型處理復(fù)雜推理任務(wù)的潛力-AssisTRAG-AI.x社區(qū)

參考文獻(xiàn)

Boosting the Potential of Large Language Models with an Intelligent Information Assistant，https://arxiv.org/pdf/2411.06805v1

本文轉(zhuǎn)載自公眾號大模型自然語言處理作者：余俊暉

原文鏈接：??https://mp.weixin.qq.com/s/fLO1i9uW8R4OQbF9nYGP9Q??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

已于2024-11-28 18:53:15修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

三大關(guān)鍵技術(shù)看RAG如何提升LLM的能力

angel ? 8190瀏覽 ? 0回復(fù)
ICLR'24 | 對比學(xué)習(xí)引入全周期時間序列信息提升長周期時序預(yù)測效果

海因斯DK ? 4867瀏覽 ? 0回復(fù)
Transformer在復(fù)雜推理任務(wù)中的新進(jìn)展：多步邏輯推理中的匹配策略

xuxiangda ? 5715瀏覽 ? 0回復(fù)
微軟發(fā)布Florence-2：用于處理各種視覺任務(wù)的小模型

AIGC最前線 ? 4519瀏覽 ? 0回復(fù)
大語言模型在不同自然語言處理任務(wù)中的提示工程方法綜述

sbf_2000 ? 3624瀏覽 ? 0回復(fù)
用于復(fù)雜RAG任務(wù)的先進(jìn)可控Agent

PaperAgent ? 2830瀏覽 ? 0回復(fù)
大模型時代信息抽取任務(wù)該何去何從？復(fù)旦發(fā)布InstructUIE提升大模型信息抽取能力

arnoldzhw ? 4968瀏覽 ? 0回復(fù)
OpenAI 發(fā)布新模型 o1，能夠推理復(fù)雜任務(wù)，在科學(xué)、編程和數(shù)學(xué)等領(lǐng)域更牛

AI洞察Insight ? 2689瀏覽 ? 0回復(fù)
StaR ｜用少量推理數(shù)據(jù)讓模型學(xué)會通用推理能力，顯著提升模型復(fù)雜推理

arnoldzhw ? 3470瀏覽 ? 0回復(fù)
使用MCTS顯著提升LLM在復(fù)雜任務(wù)的推理能力

arnoldzhw ? 6819瀏覽 ? 0回復(fù)
混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)

大模型自然語言處理 ? 2589瀏覽 ? 0回復(fù)
讓你的RAG應(yīng)用更加智能！引入自我反思的大模型 RAG 框架(Self-RAG)

AI博物院 ? 3115瀏覽 ? 0回復(fù)
淺看大模型用于Text2SQL的綜述

大模型自然語言處理 ? 3618瀏覽 ? 0回復(fù)
當(dāng)大模型也配備“秘書”：AssistRAG 的創(chuàng)新與應(yīng)用

芝士AI吃魚 ? 2514瀏覽 ? 0回復(fù)
多模態(tài)大模型Reyes增加batch推理方式，提升推理速度

大模型自然語言處理 ? 2359瀏覽 ? 0回復(fù)
LMEDR對話模型：引入自然語言推理數(shù)據(jù)提升對話模型的連貫性和一致性

arnoldzhw ? 2267瀏覽 ? 0回復(fù)
在自然語言處理(NLP)任務(wù)中，怎么處理數(shù)據(jù)——即怎么把文字輸入到模型中進(jìn)行處理？

AI探索時代 ? 2082瀏覽 ? 0回復(fù)
人工智能小白到高手：RAG通過重排（Reranking）提升信息檢索的質(zhì)量

AI取經(jīng)路 ? 2016瀏覽 ? 0回復(fù)
大模型數(shù)據(jù)預(yù)處理——關(guān)于復(fù)雜文檔在大模型應(yīng)用中的解決方案

AI探索時代 ? 1776瀏覽 ? 0回復(fù)

大模型自然語言處理

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

RAG知識庫構(gòu)建新框架-EasyDoc小模型+多模態(tài)大模型結(jié)合的文檔智能解析框架 3天前發(fā)布
用于實時工業(yè)社區(qū)問答的RAG新框架-ComRAG 4天前發(fā)布

熱門推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

AI Agents開源工具棧全解析~ 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實測：真·超DS！ 1回復(fù)

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復(fù)

我把DeepSeek微調(diào)參數(shù)扒光了，顯存和性能優(yōu)化的秘密都在這 0回復(fù)

上一篇：多模態(tài)RAG-VisRAG：基于視覺的檢索增強(qiáng)生成在多模態(tài)文檔上的應(yīng)用

下一篇： R2AG:將檢索信息融入RAG，提升問答系統(tǒng)準(zhǔn)確性

社區(qū)精華內(nèi)容

目錄

<em id="spc1d"><span id="spc1d"></span></em>