偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<u id="b30hw"><menu id="b30hw"></menu></u><pre id="b30hw"></pre>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

一文讀懂大模型協(xié)作策略：Merge、Ensemble、Cooperate！

發(fā)布于 2024-7-12 10:28

瀏覽

0收藏

大型語言模型（LLMs）時代協(xié)作策略是一個新興研究領域，協(xié)作策略可以分為三種主要方法：合并（Merging）、集成（Ensemble）和合作（Cooperation）。

每個模型都有其獨特的優(yōu)勢，這種多樣性促進了這些模型之間的合作研究

一文讀懂大模型協(xié)作策略：Merge、Ensemble、Cooperate！-AI.x社區(qū)

盡管LLMs通過ICL和指令跟隨在各種任務上表現(xiàn)出強大的多樣性，但不同的LLMs在訓練語料庫和模型架構(gòu)上的差異導致它們在不同任務上有不同的優(yōu)勢和劣勢，有效的協(xié)作可以發(fā)揮它們的綜合潛力。

對大型語言模型（LLM）協(xié)作的主要分類

一文讀懂大模型協(xié)作策略：Merge、Ensemble、Cooperate！-AI.x社區(qū)

LLMs協(xié)作方法的分類：

合并（Merging）：在參數(shù)空間中整合多個LLMs，創(chuàng)建一個統(tǒng)一的、更強大的模型。
集成（Ensemble）：結(jié)合不同模型的輸出以獲得一致的結(jié)果。
合作（Cooperation）：利用不同LLMs的多樣化能力來實現(xiàn)特定目標，如高效計算或知識轉(zhuǎn)移。

不同協(xié)作策略的示意圖，圖中的每種動物代表一個不同的大型語言模型（LLM）

一文讀懂大模型協(xié)作策略：Merge、Ensemble、Cooperate！-AI.x社區(qū)

合并（Merging）方法

合并策略旨在通過在參數(shù)空間中整合多個模型來創(chuàng)建一個統(tǒng)一的、更強大的模型：

合并的目的：合并方法旨在解決單一模型可能存在的限制，如信息缺失、陷入局部最優(yōu)或缺乏多任務能力。
合并為相對最優(yōu)解（M-ROS）：

描述了深度學習模型在訓練過程中可能無法達到精確最優(yōu)解的現(xiàn)象。
提出了通過合并多個模型的參數(shù)來獲得更好的相對最優(yōu)解的方法，包括簡單平均和加權(quán)平均兩種方法。

基本M-ROS方法：

簡單平均：將多個微調(diào)模型的參數(shù)以相等的系數(shù)進行平均，以創(chuàng)建一個更強的模型。
加權(quán)平均：根據(jù)模型的重要性或質(zhì)量分配不同的系數(shù)，以實現(xiàn)更好的合并。

合并以增強多任務能力（M-MTC）：

通過合并具有不同能力的模型來構(gòu)建具有多任務能力的統(tǒng)一模型的嘗試。
介紹了基于加權(quán)平均、基于任務屬性和基于增量訓練的方法來解決模型參數(shù)空間中的分歧問題。

基于任務屬性的合并方法：

定義了任務向量τt，這是一個指定預訓練模型參數(shù)空間中方向的向量，該方向的移動可以提高特定任務的性能。
解決參數(shù)沖突的方法，包括參數(shù)沖突解決、減少參數(shù)方法和工具包（Toolkit）。

基于增量訓練的方法：

提出了通過增量學習技術來恢復原始性能的方法，如尋找模型參數(shù)空間中的共享低維子空間以最小化任務干擾。

合并方法的局限性：

當前模型合并方法僅適用于具有相同架構(gòu)和參數(shù)空間的模型，對于參數(shù)不兼容的模型，如LLaMA和QWen，當前的合并技術是無效的。?

集成（Ensemble）方法

集成方法是一種通過結(jié)合多個模型的輸出來提高整體性能的策略，探討了在推理前、推理中和推理后進行集成的不同方法，以及它們?nèi)绾斡绊懲评硭俣?、集成粒度和面臨的限制。

在推理之前（a）、推理期間（b）和推理之后（c）的大型語言模型（LLM）集成方法的示意圖。

一文讀懂大模型協(xié)作策略：Merge、Ensemble、Cooperate！-AI.x社區(qū)

集成學習的重要性：與傳統(tǒng)的分類任務不同，LLMs通常通過文本生成來解決各種任務，因此它們的輸出更加靈活和自然。這要求為LLMs設計特定的集成方法。
LLM集成方法論：

根據(jù)集成發(fā)生的時間點，將集成方法分為三類：推理前（Before Inference）、推理中（During Inference）和推理后（After Inference）。

推理前的集成（Before Inference）：

這類方法在推理前選擇最適合特定輸入樣本的LLM，例如通過訓練外部路由器來選擇最優(yōu)的LLM。

推理中的集成（During Inference）：

在推理期間，LLMs自回歸地生成令牌。這類方法在每個解碼步驟中執(zhí)行集成，以減少早期錯誤隨時間累積的影響。

推理后的集成（After Inference）：

這類方法在推理后結(jié)合生成的輸出，例如構(gòu)建LLM級聯(lián)以減少僅使用大型LLMs的推理成本，或者從多個LLMs生成的候選中選擇最佳輸出。?

推理速度：

集成方法通常會降低推理速度，尤其是在推理期間和推理后的集成方法。

集成粒度：

推理前和推理后的集成方法通常在示例級別工作，提供粗粒度集成；而推理中的集成方法在令牌級別工作，提供細粒度集成。?

合作（Cooperation）方法

在大型語言模型（LLMs）的時代，協(xié)作策略不僅僅局限于簡單的合并或集成。越來越多的研究正專注于通過LLMs之間的合作來解決各種問題或特定任務的更廣泛方法，根據(jù)目標可以分為不同合作策略：

高效計算：通過輸入壓縮和推測性解碼來加速模型推理。

大型語言模型（LLMs）與壓縮模塊合作進行輸入壓縮

一文讀懂大模型協(xié)作策略：Merge、Ensemble、Cooperate！-AI.x社區(qū)

大型語言模型（LLMs）與草稿生成器合作進行推測性解碼

一文讀懂大模型協(xié)作策略：Merge、Ensemble、Cooperate！-AI.x社區(qū)

知識轉(zhuǎn)移：通過合作在推理階段轉(zhuǎn)移知識，而不是涉及訓練。

知識轉(zhuǎn)移的重要性：由于直接訓練大型模型獲取新知識既困難又成本高昂，因此通過合作轉(zhuǎn)移知識或能力成為一個重要的研究方向。
知識轉(zhuǎn)移的方法：

幾種主要的方法，包括減少錯誤知識（Mitigating Incorrect Knowledge）、加強正確知識（Strengthening Correct Knowledge）和提供新知識（Supplying New Knowledge）。

減少錯誤知識：

LLMs在生成文本時可能出現(xiàn)的幻覺（hallucinations）和偏見（bias）問題，并提出了對比解碼（Contrastive Decoding, CD）等方法來減少這些問題。

加強正確知識：

如何通過額外的模型來增強解碼輸出的忠實度，例如使用屬性控制文本生成（attribute-controlled text generation）和驗證方法來提高輸出與輸入或指令的一致性。

提供新知識：

觀察到輸出邏輯的變化反映了LLMs能力的變化，并提出了調(diào)整輸出邏輯來為大型模型提供從小模型中提取的新能力的方法。?
補償性合作：引入額外的控制器來補償LLMs的不足，如檢測器和檢索器。

一文讀懂大模型協(xié)作策略：Merge、Ensemble、Cooperate！-AI.x社區(qū)

一文讀懂大模型協(xié)作策略：Merge、Ensemble、Cooperate！-AI.x社區(qū)

聯(lián)邦合作：通過聯(lián)邦學習和聯(lián)邦提示工程來保護用戶隱私并有效執(zhí)行命令。

大型語言模型（LLMs）在聯(lián)邦學習中與客戶端模型合作

一文讀懂大模型協(xié)作策略：Merge、Ensemble、Cooperate！-AI.x社區(qū)

https://arxiv.org/abs/2407.06089
Merge, Ensemble, and Cooperate! A Survey on Collaborative Strategies in the Era of Large Language Models

本文轉(zhuǎn)載自??PaperAgent??

標簽

贊

收藏

回復

舉報

回復

相關推薦

【一文讀懂】基于Havenask向量檢索+大模型，構(gòu)建可靠的智能問答服務

wx5bbef785639a1 ? 3531瀏覽 ? 0回復
一文讀懂OpenGVLab帶來的最新視覺預訓練框架

魯班模錘1 ? 2541瀏覽 ? 0回復
一文讀懂：從RAG到多模態(tài)RAG

kede96 ? 4332瀏覽 ? 0回復
一文讀懂GraphRAG大模型知識圖譜

數(shù)字化助推器 ? 4802瀏覽 ? 0回復
優(yōu)雅談大模型：一文讀懂LoRA/DoRA/MoRA

魯班模錘1 ? 4072瀏覽 ? 0回復
一文讀懂LLMs的幻覺問題和對策

數(shù)字化助推器 ? 2882瀏覽 ? 0回復
融合、集成與協(xié)作！大語言模型時代的協(xié)作策略綜述

AIRoobt ? 3902瀏覽 ? 0回復
一文讀懂 DeepSeek-V3 技術報告

xuxiangda ? 5110瀏覽 ? 0回復
一文讀懂 DeepSeek-R1：大語言模型推理能力進化的秘密武器

十一月雨_55 ? 5813瀏覽 ? 0回復
帶你一文讀懂爆火的 DeepSeek-R1 新模型技術，為何震動了全球 AI 圈

玄姐聊AGI ? 7994瀏覽 ? 1回復
一文讀懂 PPO 與 GRPO：LLM 訓練的關鍵算法

鴻煊的學習筆記 ? 7525瀏覽 ? 0回復
一文讀懂 RAG 中的 embedding model

鴻煊的學習筆記 ? 3043瀏覽 ? 0回復
一文讀懂 DeepSeek使用的 MoE 架構(gòu)到底是什么

九歌AI大模型 ? 2977瀏覽 ? 0回復
一文讀懂AI智能體：概念、特性、類型與應用全解析

Halo咯咯 ? 4970瀏覽 ? 0回復
一文讀懂 15 種注意力機制

智駐未來 ? 3591瀏覽 ? 0回復
一文讀懂AI智能體融合與數(shù)據(jù)隱私安全問題

數(shù)字化助推器 ? 1804瀏覽 ? 0回復
一文讀懂 DeepSeek-R1 的 “最強外掛” GRPO 算法

鴻煊的學習筆記 ? 3079瀏覽 ? 0回復
一文讀懂Transformer架構(gòu)的三大變體

智駐未來 ? 2529瀏覽 ? 0回復
智駕｜一文讀懂大模型訓練的技術框架和優(yōu)化策略

數(shù)字化助推器 ? 1152瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

Doc2X：為知識庫RAG接上高精度文檔解析的“智能引擎” 7天前發(fā)布
RAG-Anything：全面的一體化多模態(tài)文檔處理 RAG 系統(tǒng) 7天前發(fā)布

熱門推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

AI Agents開源工具棧全解析~ 0回復

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復

上一篇： Jina AI將LLM Reranker延遲打下來了：21秒變3秒！

下一篇： GraphRAG項目雨后春筍般涌現(xiàn)！

社區(qū)精華內(nèi)容

目錄

<cite id="aip02"></cite>

<table id="aip02"></table>