偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

一篇大模型Agentic框架到應(yīng)用最新綜述:一文讀懂LLM推理框架的前沿進(jìn)展

人工智能
大型語(yǔ)言模型憑借其強(qiáng)大的泛化能力和推理能力,正在迅速重塑從日常生活到特定領(lǐng)域研究的眾多方面。然而,傳統(tǒng)的LLM主要進(jìn)行單步推理,難以處理需要多步驟、多角度思考的復(fù)雜任務(wù)。

圖片圖片

最近,由北京交通大學(xué)、蘭卡斯特大學(xué)、馬克斯·普朗克信息學(xué)研究所和電子科技大學(xué)的研究人員共同完成的一項(xiàng)重要綜述研究《LLM-based Agentic Reasoning Frameworks: A Survey from Methods to Scenarios》為我們系統(tǒng)梳理了LLM領(lǐng)域的最新進(jìn)展。

研究團(tuán)隊(duì)觀察到,盡管LLM在各個(gè)領(lǐng)域展現(xiàn)出巨大潛力,但它們?nèi)源嬖谝恍﹥?nèi)在限制,如幻覺(jué)問(wèn)題、知識(shí)過(guò)時(shí)以及高昂的訓(xùn)練和推理成本。這些問(wèn)題限制了LLM在醫(yī)療保健和軟件工程等關(guān)鍵領(lǐng)域的應(yīng)用。為了克服這些障礙,學(xué)術(shù)界積極探索將LLM作為核心引擎,構(gòu)建能夠執(zhí)行復(fù)雜多步推理任務(wù)的LLM代理推理框架。

技術(shù)背景:從LLM到代理系統(tǒng)

大型語(yǔ)言模型憑借其強(qiáng)大的泛化能力和推理能力,正在迅速重塑從日常生活到特定領(lǐng)域研究的眾多方面。然而,傳統(tǒng)的LLM主要進(jìn)行單步推理,難以處理需要多步驟、多角度思考的復(fù)雜任務(wù)。

代理系統(tǒng)(Agent Systems)的出現(xiàn)解決了這一限制。代理被定義為"通過(guò)傳感器感知環(huán)境并通過(guò)執(zhí)行器對(duì)環(huán)境采取行動(dòng)"的系統(tǒng),能夠動(dòng)態(tài)適應(yīng)環(huán)境并采取相應(yīng)行動(dòng)。這種新興范式有機(jī)地集成了規(guī)劃、記憶和工具使用等關(guān)鍵模塊,將LLM重塑為能夠感知環(huán)境、動(dòng)態(tài)適應(yīng)并采取持續(xù)行動(dòng)的任務(wù)執(zhí)行者。

圖1 展示了從2020年到2025年LLM代理框架相關(guān)出版物數(shù)量的快速增長(zhǎng)趨勢(shì),表明該領(lǐng)域正受到越來(lái)越多的關(guān)注。研究團(tuán)隊(duì)指出,這一趨勢(shì)不僅在學(xué)術(shù)界明顯,在工業(yè)界也得到了廣泛反映,科技巨頭正積極將代理工作流程整合到其核心業(yè)務(wù)中。圖1 展示了從2020年到2025年LLM代理框架相關(guān)出版物數(shù)量的快速增長(zhǎng)趨勢(shì),表明該領(lǐng)域正受到越來(lái)越多的關(guān)注。研究團(tuán)隊(duì)指出,這一趨勢(shì)不僅在學(xué)術(shù)界明顯,在工業(yè)界也得到了廣泛反映,科技巨頭正積極將代理工作流程整合到其核心業(yè)務(wù)中。

圖1 展示了從2020年到2025年LLM代理框架相關(guān)出版物數(shù)量的快速增長(zhǎng)趨勢(shì),表明該領(lǐng)域正受到越來(lái)越多的關(guān)注。研究團(tuán)隊(duì)指出,這一趨勢(shì)不僅在學(xué)術(shù)界明顯,在工業(yè)界也得到了廣泛反映,科技巨頭正積極將代理工作流程整合到其核心業(yè)務(wù)中。

代理推理框架的系統(tǒng)化分類(lèi)

該論文的核心貢獻(xiàn)是提出了一個(gè)系統(tǒng)化的分類(lèi)法,將代理推理框架分為三個(gè)漸進(jìn)層次:單代理方法基于工具的方法多代理方法。

圖片圖片

為了清晰地描述這一復(fù)雜過(guò)程,研究團(tuán)隊(duì)提出了一個(gè)通用推理算法(論文中的算法1)和一套符號(hào)表示系統(tǒng)(論文中的表1)。這些形式化描述為理解不同代理推理框架提供了統(tǒng)一的理論基礎(chǔ)。

一、單代理方法

單代理方法專(zhuān)注于增強(qiáng)單個(gè)代理的認(rèn)知和決策能力。從外部指導(dǎo)和內(nèi)部?jī)?yōu)化的角度,論文將單代理方法分為兩大類(lèi):提示工程自我改進(jìn)

1.1 提示工程

提示工程通過(guò)豐富代理的初始上下文來(lái)增強(qiáng)其性能,對(duì)應(yīng)于算法1中的上下文初始化步驟(第1行)。這一概念轉(zhuǎn)變可以表示為:

圖片圖片

圖3詳細(xì)展示了提示工程的四種方法:

  1. 角色扮演:為代理分配特定角色,如"你是一位專(zhuān)業(yè)的數(shù)據(jù)科學(xué)家"或"扮演一位資深歷史學(xué)家"。這鼓勵(lì)代理利用與該角色相關(guān)的專(zhuān)業(yè)知識(shí)、認(rèn)知框架和語(yǔ)言風(fēng)格。通過(guò)采用角色,模型可以更好地激活特定領(lǐng)域知識(shí),并以更專(zhuān)業(yè)的視角構(gòu)建其推理過(guò)程。
  2. 環(huán)境模擬:通過(guò)描述代理操作的特定設(shè)置來(lái)上下文化代理。這提供了與任務(wù)相關(guān)的背景信息、規(guī)則和約束,使代理能夠做出與模擬世界更好地一致的決策。這些環(huán)境可以范圍從模擬現(xiàn)實(shí)世界場(chǎng)景(如股票市場(chǎng)或醫(yī)療診所)到完全虛擬設(shè)置(如視頻游戲世界)。
  3. 任務(wù)描述:清晰的任務(wù)描述概述了主要目標(biāo)、約束和預(yù)期輸出格式,是幾乎每個(gè)代理系統(tǒng)的基石。結(jié)構(gòu)良好的任務(wù)描述指導(dǎo)代理將復(fù)雜問(wèn)題分解為一系列可管理的子任務(wù)。

1.2 自我改進(jìn)

自我改進(jìn)機(jī)制鼓勵(lì)代理通過(guò)內(nèi)省和自主學(xué)習(xí)來(lái)增強(qiáng)其推理能力。

圖片圖片

圖4總結(jié)了三種互補(bǔ)的范式:

二、基于工具的方法

雖然通用代理推理框架(算法1)通過(guò)單個(gè)實(shí)體概念化了工具使用,但這種抽象對(duì)于推理與特定環(huán)境能力深度交織的復(fù)雜場(chǎng)景來(lái)說(shuō)是不夠的。論文將這一單個(gè)實(shí)體擴(kuò)展為一個(gè)全面的工具集,其中每個(gè)代表代理可用的不同工具。

圖5研究團(tuán)隊(duì)將基于工具的推理流程分解為三個(gè)基本階段:工具集成、工具選擇和工具利用。圖5研究團(tuán)隊(duì)將基于工具的推理流程分解為三個(gè)基本階段:工具集成、工具選擇和工具利用。

圖5研究團(tuán)隊(duì)將基于工具的推理流程分解為三個(gè)基本階段:工具集成、工具選擇和工具利用。

2.1 工具集成

在代理選擇和利用工具之前,工具首先必須在代理的操作環(huán)境中可訪(fǎng)問(wèn)。這種架構(gòu)集成定義了代理與工具之間的接口和通信協(xié)議。論文將這些集成模式分為三種主要模型:基于API的集成、基于插件的集成基于中間件的集成

  1. 基于API的集成:API(應(yīng)用程序編程接口)為集成外部工具提供了標(biāo)準(zhǔn)。API提供了穩(wěn)定、文檔齊全的合同,允許代理與工具(如網(wǎng)絡(luò)搜索引擎)交互,而無(wú)需理解其內(nèi)部實(shí)現(xiàn)。代理只需學(xué)習(xí)根據(jù)API規(guī)范制定請(qǐng)求并解析返回的數(shù)據(jù)。
  2. 基于插件的集成:插件是直接在代理自身運(yùn)行時(shí)環(huán)境中加載和執(zhí)行的軟件組件。與外部API調(diào)用不同,插件以更低的延遲運(yùn)行,并且對(duì)代理內(nèi)部狀態(tài)有更深入的訪(fǎng)問(wèn)權(quán)限。檢索增強(qiáng)生成(RAG)是基于插件集成的典型情況。向量數(shù)據(jù)庫(kù)直接集成到代理系統(tǒng)中,以工具調(diào)用的形式向代理引入特定領(lǐng)域知識(shí),從而提高其答案的可信度。
  3. 基于中間件的集成:中間件是位于代理和工具之間的軟件層。這一層充當(dāng)代理的通用適配器或"操作環(huán)境",抽象了直接工具交互的復(fù)雜性,使LLM免受環(huán)境復(fù)雜性的影響。中間件層可以管理API密鑰,標(biāo)準(zhǔn)化不同工具之間的數(shù)據(jù)格式,或?yàn)榇硖峁┙y(tǒng)一的文件系統(tǒng)和執(zhí)行環(huán)境。

2.2 工具選擇

2.3 工具利用

在選擇了合適的工具后,如何有效利用這些工具成為關(guān)鍵。論文將工具利用分為三種模式:順序使用、并行使用迭代使用

三、多代理方法

雖然單代理框架展示了相當(dāng)大的能力,但它們?cè)诿鎸?duì)需要多樣化專(zhuān)業(yè)知識(shí)或復(fù)雜問(wèn)題分解的任務(wù)時(shí)本質(zhì)上面臨限制。多代理系統(tǒng)(MAS)作為一種自然解決方案出現(xiàn),利用多個(gè)代理的集體智能來(lái)應(yīng)對(duì)這些挑戰(zhàn)。

如論文中的圖6(此處添加論文中的圖6)所示,研究團(tuán)隊(duì)沿著兩個(gè)軸分析了多代理推理框架:組織架構(gòu)個(gè)體交互。組織架構(gòu)包括集中式、分布式和分層形式,決定了系統(tǒng)的結(jié)構(gòu)主干;而個(gè)體交互涉及合作、競(jìng)爭(zhēng)和協(xié)商,管理代理在追求目標(biāo)時(shí)的動(dòng)態(tài)。

3.1 組織架構(gòu)

3.2 個(gè)體交互

除了組織架構(gòu)外,多代理系統(tǒng)中的個(gè)體交互方式也對(duì)其性能產(chǎn)生重要影響。論文將個(gè)體交互分為三種主要類(lèi)型:合作、競(jìng)爭(zhēng)協(xié)商。

  1. 合作:在合作交互中,代理共同努力實(shí)現(xiàn)共同目標(biāo)。代理共享信息、資源和專(zhuān)業(yè)知識(shí),以增強(qiáng)系統(tǒng)的整體性能。合作交互特別適合需要集體智慧或分布式專(zhuān)業(yè)知識(shí)的任務(wù),如科學(xué)研究或復(fù)雜問(wèn)題解決。
  2. 競(jìng)爭(zhēng):在競(jìng)爭(zhēng)交互中,代理追求相互沖突的目標(biāo),試圖在有限的資源或環(huán)境中勝過(guò)對(duì)方。競(jìng)爭(zhēng)交互可以激發(fā)創(chuàng)新和效率提升,特別適合需要優(yōu)化或資源分配的任務(wù),如市場(chǎng)模擬或游戲理論場(chǎng)景。
  3. 協(xié)商:協(xié)商交互介于合作和競(jìng)爭(zhēng)之間,代理通過(guò)談判和妥協(xié)來(lái)達(dá)成互利解決方案。協(xié)商交互特別適合需要平衡多方利益的任務(wù),如資源分配、沖突解決或決策制定。

應(yīng)用場(chǎng)景分析

論文不僅系統(tǒng)梳理了代理推理框架的方法學(xué),還深入分析了這些框架在幾個(gè)關(guān)鍵應(yīng)用場(chǎng)景中的應(yīng)用。這些場(chǎng)景包括科學(xué)發(fā)現(xiàn)醫(yī)療保健、軟件工程、社會(huì)模擬經(jīng)濟(jì)學(xué)

1. 科學(xué)發(fā)現(xiàn)

在科學(xué)發(fā)現(xiàn)領(lǐng)域,代理推理框架被用于加速研究過(guò)程、生成假設(shè)、分析實(shí)驗(yàn)數(shù)據(jù)甚至設(shè)計(jì)實(shí)驗(yàn)。論文詳細(xì)分析了代理如何通過(guò)多步推理和工具使用來(lái)處理復(fù)雜的科學(xué)問(wèn)題,如材料科學(xué)中的新材料發(fā)現(xiàn)、生物學(xué)中的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)等。

2. 醫(yī)療保健

在醫(yī)療保健領(lǐng)域,代理推理框架被用于疾病診斷、治療方案推薦、藥物發(fā)現(xiàn)和醫(yī)療數(shù)據(jù)分析。論文討論了代理如何整合多源醫(yī)療數(shù)據(jù)、應(yīng)用醫(yī)學(xué)知識(shí)并進(jìn)行推理,以提供準(zhǔn)確的醫(yī)療建議和支持臨床決策。

3. 軟件工程

在軟件工程領(lǐng)域,代理推理框架被用于代碼生成、調(diào)試、測(cè)試和軟件維護(hù)。論文分析了代理如何理解軟件需求、生成代碼、檢測(cè)和修復(fù)錯(cuò)誤,以及優(yōu)化軟件性能。

4. 社會(huì)模擬

在社會(huì)模擬領(lǐng)域,代理推理框架被用于模擬人類(lèi)行為、社會(huì)動(dòng)態(tài)和群體決策。論文探討了代理如何模擬個(gè)體和群體的行為模式,以及如何預(yù)測(cè)社會(huì)現(xiàn)象和趨勢(shì)。

5. 經(jīng)濟(jì)學(xué)

在經(jīng)濟(jì)學(xué)領(lǐng)域,代理推理框架被用于市場(chǎng)分析、經(jīng)濟(jì)預(yù)測(cè)和政策評(píng)估。論文討論了代理如何模擬市場(chǎng)行為、分析經(jīng)濟(jì)數(shù)據(jù)并預(yù)測(cè)經(jīng)濟(jì)趨勢(shì)。

評(píng)估策略

為了全面評(píng)估不同代理推理框架的性能,論文總結(jié)了多種評(píng)估策略。這些策略包括:

  1. 任務(wù)完成度評(píng)估:衡量代理完成特定任務(wù)的能力和效果。
  2. 推理質(zhì)量評(píng)估:評(píng)估代理推理過(guò)程的邏輯性、一致性和準(zhǔn)確性。
  3. 效率評(píng)估:衡量代理完成任務(wù)所需的資源和時(shí)間。
  4. 魯棒性評(píng)估:測(cè)試代理在面對(duì)不確定性和變化時(shí)的適應(yīng)能力。
  5. 可解釋性評(píng)估:評(píng)估代理決策過(guò)程的透明度和可理解性。

論文還討論了不同應(yīng)用場(chǎng)景下的評(píng)估數(shù)據(jù)集和基準(zhǔn)測(cè)試,為研究人員提供了評(píng)估代理推理框架的全面指導(dǎo)。

未來(lái)方向與結(jié)論

在論文的最后部分,研究團(tuán)隊(duì)討論了代理推理框架的未來(lái)發(fā)展方向,包括:

  1. 更強(qiáng)大的推理能力:開(kāi)發(fā)能夠進(jìn)行更復(fù)雜、更抽象推理的代理。
  2. 更好的工具集成:改進(jìn)代理與外部工具的集成方式,擴(kuò)展代理的能力范圍。
  3. 更高效的多代理協(xié)作:優(yōu)化多代理系統(tǒng)中的協(xié)作機(jī)制,提高集體智能的效率。
  4. 更安全的代理行為:確保代理行為的安全性、可靠性和道德性。
  5. 更廣泛的應(yīng)用場(chǎng)景:將代理推理框架應(yīng)用于更多領(lǐng)域和場(chǎng)景。
責(zé)任編輯:武曉燕 來(lái)源: AIGC深一度
相關(guān)推薦

2024-05-27 00:45:00

2024-11-29 18:37:07

2025-04-10 00:12:00

2023-12-10 14:59:53

2024-06-24 14:32:33

2024-11-27 13:37:16

2024-01-15 05:55:33

2022-07-26 00:00:03

語(yǔ)言模型人工智能

2024-06-24 08:05:00

人工智能AI

2025-01-24 14:38:51

2025-04-30 10:36:17

2024-05-31 12:44:12

2024-12-27 14:45:59

2020-04-22 13:27:20

數(shù)據(jù)分析模塊解決

2017-06-08 22:41:34

框架標(biāo)簽

2017-05-05 12:59:00

大數(shù)據(jù)物聯(lián)網(wǎng)安全

2024-07-08 12:44:11

2024-02-01 08:34:30

大模型推理框架NVIDIA

2025-05-20 11:55:22

人工智能Vision RAGLLM

2023-12-30 08:12:42

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)