基于大模型的群體智能解決方案

易慧智能成立時(shí)間不長(zhǎng),背后依托的是易車公司 20 多年來積累的客戶、數(shù)據(jù)以及行業(yè)經(jīng)驗(yàn)。公司圍繞智能體以及群體智能方向于今年初與清華大學(xué)自然語言處理實(shí)驗(yàn)室、面壁智能達(dá)成戰(zhàn)略合作,結(jié)合他們先進(jìn)的技術(shù)與易車的數(shù)據(jù)積累以及行業(yè) Know-How,推出了面向 ToB 端的基于大模型的汽車行業(yè)群體智能解決方案以及相應(yīng)的技術(shù)白皮書,白皮書中對(duì)于群體智能的整體方案有比較詳細(xì)的解讀。
一、群體智能解決方案概覽
1. LLM 與 Agent

群體智能,與其緊密相關(guān)的兩大模塊為:LLM(大模型)和 Agent(智能體)。如果說 2023 年是大模型技術(shù)元年,那 2024 年應(yīng)該是大模型應(yīng)用的元年。目前最炙手可熱的大模型應(yīng)用應(yīng)該是 Agent,它是一個(gè)能夠自主完成目標(biāo)的智能體,具有規(guī)劃和執(zhí)行的能力。用車類比的話,大模型的推出相當(dāng)于汽車引擎的技術(shù)突破。而 Agent 就像一個(gè)整車,只有引擎是不夠的,還需要配骨架、座位、方向盤才能搭載人從一個(gè)地方駛向另外一個(gè)地方。所以 Agent 是基于大模型之上包了個(gè)外殼,使它能夠做一些具體的事情。
2. AI 傳統(tǒng)工具 VS AI Agent

Agent 與傳統(tǒng)人工智能的差別是什么呢?其差別在于傳統(tǒng)工具是人定義好一個(gè)流程,比如要質(zhì)檢一通邀約客戶到店的對(duì)話,我們首先需要行業(yè)專家去定義質(zhì)檢流程及質(zhì)檢項(xiàng)。人工智能在這個(gè)過程中能在某個(gè)質(zhì)檢項(xiàng)的檢測(cè)中提升質(zhì)檢的準(zhǔn)確率,但整個(gè)流程和質(zhì)檢規(guī)則實(shí)際上還是人類主導(dǎo)。而 Agent 是不需要人去干預(yù),它自己做規(guī)劃,包括判斷通話流程是否專業(yè),中間有哪些不合規(guī)的地方。所以 Agent 相對(duì) AI 傳統(tǒng)工具根本性的一個(gè)差別就是原來是以人為主導(dǎo),現(xiàn)在則是以大模型 AI 為主導(dǎo)。
3. 超級(jí)個(gè)體 VS 群體智慧

那是不是可以認(rèn)為有一個(gè)超級(jí)智能體就能解決所有問題?從人類社會(huì)、自然界角度來看,通過多個(gè)個(gè)體共同去完成一件事,往往能夠比超級(jí)個(gè)體達(dá)到更好的效果,中國(guó)有句老話:三個(gè)臭皮匠,頂個(gè)諸葛亮,就是這個(gè)意思。自然界的例子是蟻群效應(yīng):整個(gè)蟻群能夠根據(jù)環(huán)境變化快速進(jìn)行調(diào)整,并不是依賴于既有的分工和流程。例如,當(dāng)螞蟻在同時(shí)發(fā)現(xiàn)食物后,會(huì)分別走兩條路線回到巢穴,并釋放信息素,最終整個(gè)蟻群會(huì)選擇最近的路線去搬運(yùn)食物,這個(gè)就是群體智慧的體現(xiàn)

當(dāng)前學(xué)術(shù)界群體智能方向的進(jìn)展也非???,比如有個(gè) paper 設(shè)計(jì)了一個(gè)實(shí)驗(yàn),通過構(gòu)造 2 個(gè) Agent,去解決同一個(gè)問題,其中一個(gè) Agent 扮演負(fù)責(zé)人,另外一個(gè) Agent 扮演咨詢師,他們通過多輪對(duì)話、啟發(fā)、討論的方式去把解決方案從 0 到 1 的打磨完善出來。這個(gè)最終的解決方案對(duì)比只用單一 Agent 生成的解決方案要更加專業(yè)。我們認(rèn)為這是“智能的第二次涌現(xiàn)”,即群體智能。智能的第一次涌現(xiàn)是大模型,現(xiàn)在是多個(gè) Agent 去交互碰撞,產(chǎn)生第二次智能。

兩次智能涌現(xiàn)的本質(zhì)是什么呢?第一次智能涌現(xiàn)是神經(jīng)網(wǎng)絡(luò)的神經(jīng)元達(dá)到一定量級(jí)后產(chǎn)生了質(zhì)變,大模型技術(shù)其實(shí)已經(jīng)發(fā)展很多年了,包括最早 2018 年 Bert 本身也是大模型,之所以 GPT 帶來革命性的影響,是因?yàn)槠鋮?shù)超過了一定量級(jí),突破了 100 億、1000 億,甚至到 1 萬億,量變產(chǎn)生質(zhì)變。第二次群體智能的涌現(xiàn)的本質(zhì)是,當(dāng)單體 Agent 足夠多,各行各業(yè)都有專業(yè)的 Agent,如果把這些 Agent 都聚集起來,協(xié)同合作的去完成某項(xiàng)任務(wù),這個(gè)過程中有可能會(huì)產(chǎn)生新的發(fā)現(xiàn)。我們預(yù)判接下來群體智能技術(shù)將會(huì)受到更多關(guān)注。

從實(shí)踐上看也是會(huì)經(jīng)歷這樣的過程,比如有一個(gè)具體任務(wù),寫行業(yè)報(bào)告,現(xiàn)在通過單智能體,可能需要準(zhǔn)備一個(gè)非常復(fù)雜的 prompt,里面需要涵蓋如何去寫摘要,框架、調(diào)研、總結(jié),每個(gè)篇章要去找數(shù)據(jù)支撐,然后完善篇章內(nèi)容,整理成報(bào)告。這樣一個(gè)任務(wù)用一個(gè) Agent 是很難實(shí)現(xiàn)的。但是如果我們把任務(wù)進(jìn)行拆分,比如設(shè)計(jì) 4 個(gè) Agent,第一個(gè) Agent 專注去做需求分析;第二個(gè) Agent 去找素材和論據(jù);第三個(gè) Agent 把前面素材整理成報(bào)告;最后一個(gè) Agent 審核校驗(yàn)。實(shí)際上現(xiàn)實(shí)中人們也是這么做的,用多個(gè) Agent 實(shí)現(xiàn),每個(gè) Agent 只需要把一項(xiàng)技能在 Prompt 中描述清楚,把單個(gè) Agent 的能力做到極致。所以在真正落地的時(shí)候,我們自然就會(huì)向群體智能方向走。從理論和實(shí)踐上來看,群體智能一定是未來的一個(gè)發(fā)展方向。
4. 基于大模型的汽車行業(yè)群體智能業(yè)務(wù)架構(gòu)

如上圖所示是基于大模型的汽車行業(yè)群體智能整體的業(yè)務(wù)架構(gòu)。主要分為三層:
最底層是 YiCPM 汽車行業(yè)大模型,它不是某一個(gè)具體的模型,而是多個(gè)大模型的集合,包括語言模型、圖像模型、視頻模型、語音模型等,考慮到大模型發(fā)展日新月異,一方面我們會(huì)積極擁抱和嘗試技術(shù)領(lǐng)先的開源大模型,另一方面我們也會(huì)探索自研,自研還是往能交付的小參數(shù)模型方向走。因?yàn)閹资畠|、上百億參數(shù)的模型成本太高,企業(yè)不會(huì)買單,所以為了降低交付成本我們主要在小模型方向進(jìn)行探索。
中間層是整個(gè)解決方案的核心,智能體平臺(tái)。我們與清華大學(xué)自然語言處理實(shí)驗(yàn)室、面壁智能公司合作,依托于 XAgent 和 AgentVerse 兩個(gè)開源框架,構(gòu)建了我們自研的 YiAgents 群體智能框架。
再往上是依托于這個(gè)框架的上層應(yīng)用,主要是從營(yíng)銷場(chǎng)景出發(fā)找到的五個(gè)落地場(chǎng)景。
上圖右側(cè)是生態(tài)矩陣,數(shù)據(jù)和行業(yè) know how 對(duì)于做大模型很關(guān)鍵,真正要解決行業(yè)具體的問題,需要行業(yè)的一些工具和能力,這是一個(gè)共創(chuàng)的過程。
二、Yi Agents 群體智能平臺(tái)
1. 構(gòu)建多智能體框架面臨的關(guān)鍵問題

要設(shè)計(jì)多智能體的框架,會(huì)面臨以下幾個(gè)比較關(guān)鍵的問題:
- 要做群體智能,先得有單體的 Agent,再利用單體智能組合產(chǎn)生群體智能,對(duì)單智能體進(jìn)行設(shè)計(jì)和劃分,單體智能體劃分得越明確,群體智能方案越好做。
- 有了多個(gè)單智能體之后,智能體們所在的環(huán)境也需要做定義,所有的智能體都在一個(gè)環(huán)境里面工作。
- 最后是多個(gè)智能體之間如何交流,需要定義他們之間的交流鏈,是串行的或者并行的,要考慮不同應(yīng)用場(chǎng)景智能體間的通信方式。
2. 設(shè)計(jì)多智能體交互框架的四大關(guān)鍵要素

設(shè)計(jì)多智能體交互有四個(gè)關(guān)鍵要素:
- 基礎(chǔ)設(shè)施:是否足夠通用。
- 協(xié)作模式:需要支持多種協(xié)作模式,人類社會(huì)也是如此,比如有串行、并行,先串行再并行,兩個(gè)智能體之間是合作還是競(jìng)爭(zhēng)等等。
- 執(zhí)行能力:需要有能夠使用工具的能力。垂直領(lǐng)域的壁壘就在于其不是解決一個(gè)通用的問題,需要用行業(yè)特有的一些工具去實(shí)現(xiàn)。如果沒有工具,就要能夠創(chuàng)造工具。
- 人類參與:系統(tǒng)是否允許人類在執(zhí)行過程中參與以及如何參與。
3. 技術(shù)框架

上圖所示是白皮書里偏流程的技術(shù)框架,包括五個(gè)具體的技術(shù)點(diǎn):
- 首先做目標(biāo)和任務(wù)拆解,即任務(wù)分成幾步,每一步驟怎么做。
- 拆解出的每一個(gè)任務(wù),誰去做,這里需要有單體智能,每一個(gè)智能體要足夠?qū)I(yè)能去完成這個(gè)任務(wù),這里涉及到智能體的技術(shù)。
- 多個(gè)智能體協(xié)作:多個(gè)智能體之間要有交流鏈和 workflow,它們之間是怎么交流的。
- context:即環(huán)境,多個(gè)智能體在一起需要共享和沉淀一些信息。
- 對(duì)齊技術(shù):大模型的優(yōu)勢(shì)是很有創(chuàng)造性,但又可能容易產(chǎn)生幻覺,這是一對(duì)不可調(diào)和的矛盾,這兩者之間要有一個(gè) trade off。

多智能體技術(shù)框架按上述五個(gè)點(diǎn)拆解來講。
(1)目標(biāo)驅(qū)動(dòng)的任務(wù)管理

群體智能如何保證多個(gè)單智能體都能完成任務(wù)?利用通用的群體智能框架,它讓不同角色完成不同的任務(wù)。首先對(duì)任務(wù)進(jìn)行規(guī)劃,根據(jù)任務(wù)的 know-how 和經(jīng)驗(yàn)知識(shí),拆解成一個(gè)工作流,分配好任務(wù)需要多少角色去完成,每個(gè)角色干什么。任務(wù)規(guī)劃完之后開始執(zhí)行,Agent 需要按照任務(wù)規(guī)劃的每一步驟去執(zhí)行。Agent 的輸入來自 prompt,因?yàn)榇竽P退械妮斎攵际?prompt, 為了讓其通用化,需要把大模型 prompt 的 template 實(shí)例化。所以當(dāng)需要執(zhí)行一個(gè)任務(wù)時(shí),流程執(zhí)行到了哪個(gè)步驟,把該步驟的 prompt 實(shí)例化,然后去執(zhí)行即可。最后是任務(wù)總結(jié),目的是不斷地反思以做得更好,可以迭代一輪或者迭代多輪,依據(jù)實(shí)際應(yīng)用場(chǎng)景而定。
(2)LLM 驅(qū)動(dòng)的智能體

群體智能的核心就是單體 Agent,而 Agent 的核心要素包括記憶、規(guī)劃、感知、執(zhí)行和使用工具的能力等。這些能力都是大語言模型提供的,上述架構(gòu)也是當(dāng)前 Agent 比較通用的技術(shù),未來隨著發(fā)展,會(huì)擴(kuò)展記憶,記憶越多,能容納的知識(shí)經(jīng)驗(yàn)就更多,但是大模型上下文空間始終是有限的,因此會(huì)更多考慮擴(kuò)展上下文長(zhǎng)度,比如當(dāng)前的 Kimi,如果空間仍然不夠就會(huì)考慮壓縮。

我們的底層框架是 XAgent,XAgent 在基礎(chǔ) Agent 框架基礎(chǔ)上引入了自我反思的過程。類比人類也是如此,優(yōu)秀員工和普通員工的差別在于優(yōu)秀員工干完一件事自己就會(huì)總結(jié)反思。XAgent 框架在單體 Agent 的基礎(chǔ)上加了兩個(gè)循環(huán),即內(nèi)外循環(huán),內(nèi)循環(huán)是執(zhí)行+自我反思,即任務(wù)執(zhí)行完畢后自我反思這個(gè)結(jié)果是否滿意,是否還能再優(yōu)化。外循環(huán)是通過多輪反思實(shí)現(xiàn)整個(gè)迭代過程。
(3)多智能體協(xié)作

多智能體協(xié)作本質(zhì)是一個(gè) workflow,從一個(gè) Agent 到下一個(gè) Agent 要解決的最關(guān)鍵的問題是 prompt 實(shí)例化,即要把 Prompt Template 里面的占位符具體化。目前業(yè)內(nèi)一般通過消息總線存儲(chǔ)信息,比如從任務(wù)下達(dá),任務(wù)拆解,到第一個(gè) Agent 執(zhí)行完,第二個(gè) Agent 執(zhí)行完、人類交互等所有這些信息都可以以 message 形式存在于消息總線里面,當(dāng)某個(gè) Agent 準(zhǔn)備執(zhí)行時(shí),它的上下文就是當(dāng)前消息總線里面的所有消息歷史,Agent 可以自己分析現(xiàn)在處于哪個(gè)環(huán)節(jié),累計(jì)產(chǎn)出了哪些中間成果,接下來干什么,所以協(xié)作的本質(zhì)就是通過消息總線傳遞信息。如果信息復(fù)雜的話可以再用一個(gè)單獨(dú)的 Agent 把信息進(jìn)行提煉總結(jié)抽取,把 Prompt Template 實(shí)例化,這樣每個(gè) Agent 自然就能串起來。
(4)上下文交互

消息總線等同于上下文、全局變量、智能體執(zhí)行的環(huán)境,消息總線可以用 message 隊(duì)列簡(jiǎn)單實(shí)現(xiàn)。智能體執(zhí)行過程中產(chǎn)生的所有信息都是 message,message 包含以下元素:
- 發(fā)送者:可能是用戶發(fā)的,也可能是上一個(gè) Agent 發(fā)的,還可能是系統(tǒng)發(fā)的。
- 接收者:要定義好一個(gè) workflow,得知道下游是誰,誰能接收該消息,誰可以忽視。
- 消息類型:消息類型有很多,任務(wù)描述、Agent 輸出結(jié)果、系統(tǒng)的狀態(tài)等。
- 消息內(nèi)容
(5)平衡自主性與一致性

大模型非常具有創(chuàng)造性,但問題是太讓其自主發(fā)揮會(huì)出現(xiàn)幻覺、前后表述不一致等現(xiàn)象,所以需要考慮自主性和一致性的折中,當(dāng)前階段它還是離不開人的干預(yù)和反饋,需要不斷的進(jìn)化,找到一個(gè)平衡點(diǎn)。

群體智能框架的技術(shù)實(shí)現(xiàn)如上圖所示:首先有一個(gè) Planner 生成計(jì)劃,然后分配任務(wù)給 performer 或叫 executor,來對(duì)每個(gè) Agent 進(jìn)行 Prompt Template 實(shí)例化,等所有 Agent 執(zhí)行完畢后,由 Reviewer 對(duì)整個(gè)任務(wù)執(zhí)行過程和結(jié)果進(jìn)行復(fù)盤總結(jié),依復(fù)盤情況可以執(zhí)行多輪。
三、群體智能技術(shù)在行業(yè)中的應(yīng)用

大模型為汽車行業(yè)帶來的價(jià)值包括:
- 高效的流程管理
- 定制化的營(yíng)銷體驗(yàn)
- 增強(qiáng)用戶服務(wù)感受
- 市場(chǎng)分析與預(yù)測(cè)
- 跨部?協(xié)作的促進(jìn)

以營(yíng)銷場(chǎng)景為例,營(yíng)銷首先是要獲客,獲客后要做線索清洗,一般業(yè)內(nèi)是根據(jù) DCC 電話進(jìn)行第一輪篩選,區(qū)分高意向、低意向客戶,針對(duì)高意向客戶直接邀約到店,低意向就開展后續(xù)的用戶運(yùn)營(yíng),比如通過加企業(yè)微信通過 IM 做一些轉(zhuǎn)化,轉(zhuǎn)換成高意向,再邀約到店,最后購(gòu)車成交。

整個(gè)流程里衍生出來五個(gè)核心落地場(chǎng)景:
- 數(shù)智研究院:整個(gè)造車流程有新車設(shè)計(jì)、研發(fā)生產(chǎn)、新車發(fā)售、口碑反饋,行業(yè)調(diào)研、戰(zhàn)略規(guī)劃等等需要數(shù)據(jù)決策的環(huán)節(jié),之前可能需要咨詢公司專業(yè)人士去做,現(xiàn)在可以把它拆成幾個(gè) Agent 協(xié)作完成,比如業(yè)務(wù)分析、數(shù)據(jù)抓取、數(shù)據(jù)分析、報(bào)告整理和校對(duì)。
- 輿情運(yùn)營(yíng):輿情運(yùn)營(yíng)比如說對(duì)于公關(guān)部門,有時(shí)候需要危機(jī)公關(guān),我們可以幫助車企及時(shí)發(fā)現(xiàn)有風(fēng)險(xiǎn)的輿情能挽回很多損失。這部分需要監(jiān)控主流社交媒體上的輿情數(shù)據(jù),Agent 需要對(duì)評(píng)論做正向、負(fù)向、中性的判斷評(píng)估,找到熱點(diǎn)事件,評(píng)控引導(dǎo)輿論,并提醒廠商人員介入。
- 新媒體運(yùn)營(yíng):主要用于生產(chǎn)營(yíng)銷素材,比如當(dāng)前依賴人工生產(chǎn)短視頻和海報(bào),現(xiàn)在機(jī)器可以生成素材,生成后到社交媒體上投放,然后關(guān)注投放效果,查找數(shù)據(jù)并進(jìn)行效果分析。
- 用戶運(yùn)營(yíng)
- 集約 DCC

以用戶運(yùn)營(yíng)為例的話,主要有以下 Agent:用戶運(yùn)營(yíng)專員、質(zhì)檢專員、標(biāo)注專員、建檔專員等。

如上圖中的案例,要邀約一個(gè)用戶到店,首先提供一些用戶信息,智能助手會(huì)給出一個(gè)工作流,這個(gè)任務(wù)需要 5 個(gè)步驟去完成。先給客戶評(píng)級(jí),接著生成邀約的開口話術(shù),參照話術(shù)進(jìn)行客戶對(duì)話邀約。對(duì)話結(jié)束后進(jìn)行建檔,最后進(jìn)行質(zhì)檢。全部流程都是自動(dòng)執(zhí)行的。

接下來按照流程逐一完成各個(gè)步驟。

整個(gè)任務(wù)完成之后,做復(fù)盤總結(jié),自我反思是否存在漏洞,哪些環(huán)節(jié)可以改進(jìn)。
(是否需要插入視頻演示)
四、汽車行業(yè)群體智能技術(shù)生態(tài)

汽車行業(yè)群體智能生態(tài)包括 4 個(gè)部分:
1. 行業(yè)解決方案伙伴

需要依賴一些行業(yè) know how,比如專業(yè)的調(diào)研報(bào)告、分析用戶群體等,需要基于行業(yè)方法論。當(dāng)前在某些具體場(chǎng)景,我們希望能夠得到行業(yè)伙伴們提供的一些行業(yè)經(jīng)驗(yàn),并將其放入知識(shí)庫(kù)。隨著 Agent 積累的經(jīng)驗(yàn)越來越多,其能力也會(huì)不斷提升。
2. 行業(yè)數(shù)據(jù)伙伴

大模型本身差異不大,而影響其效果的核心還是數(shù)據(jù)。易車更多偏 C 端的數(shù)據(jù),我們也希望獲得一些車企經(jīng)銷商對(duì)話的語料,以及機(jī)構(gòu)的行業(yè)咨詢報(bào)告等,有了這些數(shù)據(jù)才能訓(xùn)練模型。
3. 大模型伙伴

我們系統(tǒng)底層模型是一系列語言模型、多模態(tài)模型的集合,我們會(huì)持續(xù)接納業(yè)內(nèi)專業(yè)的大模型,因?yàn)椴煌P驮诓煌蝿?wù)上的效果是不一樣的,不可能用一個(gè)模型解決所有問題。
企業(yè)側(cè)模型選型,考慮到成本因素,未來還是將會(huì)向小參數(shù)量模型方向發(fā)展。
4. 行業(yè)工具伙伴

當(dāng)前業(yè)內(nèi)做 Agent 的企業(yè)很多,最終的壁壘有一部分會(huì)體現(xiàn)在行業(yè)工具上,比如營(yíng)銷場(chǎng)景需要托管企微、生成海報(bào)等,很多公司在某些領(lǐng)域已經(jīng)深入,沒有必要所有工具都自行研發(fā),每一個(gè)環(huán)節(jié)應(yīng)該由更專業(yè)的人去完成,才能最終把事做成做好。所以希望整個(gè)生態(tài)能夠?qū)崿F(xiàn)開放共贏。

各個(gè)企業(yè)貢獻(xiàn)各自的力量,才能合作共贏,促進(jìn)整個(gè)生態(tài)的發(fā)展。
五、總結(jié)和展望
技術(shù)的飛速發(fā)展,幫助我們站在了一個(gè)全新的視角,眺望汽車行業(yè)即將踏入的遼闊天地。在智能化的浪潮下,我們預(yù)見一個(gè)更加智慧、高效能、用戶至上的汽車新時(shí)代正在加速到來。
未來大模型群體智能將幫助企業(yè)進(jìn)一步降本增效,并開啟用戶運(yùn)營(yíng)新篇章,做到千人千面,進(jìn)一步提升客戶體驗(yàn)。在各大企業(yè)的創(chuàng)新與合作下,整個(gè)行業(yè)將共建智慧汽車新生態(tài)。
六、Q&A
Q1:技術(shù)框架關(guān)于任務(wù)的規(guī)劃,如何把一個(gè)大的任務(wù)拆解成一個(gè)個(gè)小的子任務(wù),如果拆分的力度過細(xì),調(diào)用鏈就可能會(huì)比較臃腫,如果拆的力度過粗,子任務(wù)完成的正確率就會(huì)降低。在這方面是否有一些方法論或?qū)嶋H經(jīng)驗(yàn)可以參考?
A1:這方面肯定是沒有標(biāo)準(zhǔn)答案的,對(duì) Agent 的定義,包括我們現(xiàn)在拆解一些行業(yè)場(chǎng)景,一件事是由一個(gè) Agent 做還是三個(gè) Agent 做也是沒有標(biāo)準(zhǔn)答案的,需要通過實(shí)踐去檢驗(yàn)。從我的經(jīng)驗(yàn)來講:
- 第一點(diǎn),planner 是非常重要的,對(duì)于某些任務(wù)來講,它要有一些行業(yè) know how 知識(shí)。比如一個(gè)行業(yè)報(bào)告,我們跟羅蘭貝格、IBM 合作,他們給我們寫出來一個(gè)命題到底該怎么拆、怎么做;
- 第二點(diǎn),每個(gè) Agent 的定義設(shè)計(jì),要描述得足夠清晰,每個(gè) Agent 干什么,比如要用戶運(yùn)營(yíng),第一步,是一個(gè)評(píng)級(jí)專員,有了評(píng)級(jí)才有后面的針對(duì)不同的用戶,才有不同的策略,這些信息一定要放到 Agent description 里面,給到 planner。提示越多它執(zhí)行起來越簡(jiǎn)單。
- 第三點(diǎn),一次規(guī)劃可能達(dá)不到理想狀態(tài),要反復(fù)嘗試,經(jīng)過多輪調(diào)整,才能達(dá)到更好的效果。
以上是一些建議。
Q2:大模型 Agent 在輿情分析這塊具體參與了什么樣的工作,和傳統(tǒng)的NLP 技術(shù)相比,其優(yōu)勢(shì)在哪里?現(xiàn)在很多 NLP 分析工作都已經(jīng)被大語言模型替代掉。
A2:Agent 其實(shí)與大模型不在一個(gè)維度。原來 NLP 只是在解決某一個(gè)節(jié)點(diǎn),某一個(gè)工作發(fā)揮了作用,比如分析輿情,要有一個(gè)情緒識(shí)別模型判斷評(píng)論到底正向負(fù)向,是在研究其中一個(gè)事如何能做得更好?,F(xiàn)在,大模型的厲害之處在于原來干一件事要訓(xùn)練一個(gè)模型,現(xiàn)在一個(gè)大語言模型可以把所有事情都做了,大大提高了效率。而 Agent 的作用是什么呢?比如輿情這件事首先得去監(jiān)控全網(wǎng)的數(shù)據(jù),定期收集這些數(shù)據(jù),然后去分析,生成一些 action,比如簡(jiǎn)單的回復(fù)等等,有一些 todo 拆解。Agent 就是對(duì)一件事進(jìn)行拆解,每一步完成不同的工作,從規(guī)劃到執(zhí)行自動(dòng)化地完成整個(gè)任務(wù)。
Q3:多智能體架構(gòu)如何利用外界信息形成一套反饋和調(diào)節(jié)機(jī)制?因?yàn)榉此计鋵?shí)是內(nèi)部的。
A3:反思還是需要借助消息總線,所有信息包括它自己生成的數(shù)據(jù)、外界給它的數(shù)據(jù)、人工的一些指令,都可以變成消息,然后放到消息池里,下一次 Agent 要具體的操作時(shí),會(huì)有輸入 prompt,可以從 Prompt 定義很多 context,包括實(shí)時(shí)消息,上一次做完的結(jié)果等。比如質(zhì)檢,剛開始沒有任何知識(shí),先質(zhì)檢了一輪后質(zhì)檢主管反饋有問題,就可以把這個(gè)信息反饋也加到 message history 里面,下一次質(zhì)檢就有上一次這個(gè)經(jīng)驗(yàn)。并沒有改變模型的參數(shù)而是把知識(shí)都沉淀到經(jīng)驗(yàn)庫(kù)里,這個(gè)經(jīng)驗(yàn)庫(kù)可以全部或者部分進(jìn)入到 Prompt 中,如果上下文空間足夠的話,全放進(jìn)去,如果不夠的話,可以通過抽取摘要進(jìn)行提煉再加入進(jìn)去。這就是反思的實(shí)現(xiàn)原理,沒有改變模型參數(shù),只是增加了上下文的經(jīng)驗(yàn)數(shù)據(jù)。
Q4:現(xiàn)在已經(jīng)把傳統(tǒng)的工作流 Agent,后續(xù)它肯定還存在一些問題,那多智能體的這樣一個(gè)系統(tǒng)迭代方向的衡量的標(biāo)準(zhǔn)怎么衡量的?
A4:多智能體處于一個(gè)比較前沿的階段,受限于知識(shí),它目前還只能處理有限的一些任務(wù)。后面經(jīng)過自我學(xué)習(xí),不斷進(jìn)化沉淀經(jīng)驗(yàn),其對(duì)于任務(wù)的覆蓋能力會(huì)增強(qiáng)。所以整個(gè)數(shù)據(jù)飛輪反饋機(jī)制是至關(guān)重要的。另外,隨著一些周邊工具的積累,其能力邊界也將得到拓展。
Q5:關(guān)于反思,內(nèi)循環(huán)的那種反思可能更多的是將歷史的一些經(jīng)驗(yàn)數(shù)據(jù)帶到下一次的上下文里面,如果有過多的較為龐雜的歷史經(jīng)驗(yàn)的話,會(huì)不會(huì)影響到最終的產(chǎn)出結(jié)果?目前對(duì)于反思是如何去評(píng)判的?我們?nèi)祟惖囊恍┙?jīng)驗(yàn)可能并不可靠,那機(jī)器提示自己的一些經(jīng)驗(yàn),該如何保證其正確性呢?
A5:針對(duì)第一個(gè)問題,很多數(shù)據(jù)是質(zhì)量較差,而放到消息總線的經(jīng)驗(yàn)庫(kù)的應(yīng)該是比較高質(zhì)量的數(shù)據(jù),把經(jīng)驗(yàn)和知識(shí)提煉成一個(gè)高質(zhì)量的經(jīng)驗(yàn)庫(kù)。精煉一方面也得通過人工的標(biāo)注,比如離線的標(biāo)注,或者通過大模型的幫助進(jìn)行提煉,我們有一個(gè)數(shù)據(jù)標(biāo)注訓(xùn)練師的 Agent,就是在做這件事。它也需要人工進(jìn)行干預(yù)。
第二個(gè)問題,怎么評(píng)判反思的結(jié)果。設(shè)計(jì)這個(gè)產(chǎn)品的機(jī)制,在產(chǎn)品側(cè)可能要預(yù)埋一些東西,比如一個(gè)對(duì)話,判斷對(duì)話效果好不好,如果回答一個(gè)問題以后,后面客戶又追問了好幾次,那通常情況下首次回答的效果就是不夠好的。再比如質(zhì)檢,要評(píng)判質(zhì)檢效果的好壞,很重要的標(biāo)準(zhǔn)就是評(píng)判完了客服沒有異議。所以這其中涉及工程化的內(nèi)容,把人類反饋融合到整個(gè)系統(tǒng)里并標(biāo)記。除此之外,它不一定是自反思,也可以引入中介,比如再引入一個(gè)模型 GPT4,作為一個(gè)裁判,讓它來判斷。甚至可以引入多個(gè)裁判,最后投票選出來一個(gè)結(jié)果,我們一般做自反饋?zhàn)詈玫姆绞绞窃僖胨?partner,它干任何事有個(gè) partner 去對(duì)應(yīng)找漏洞,然后觸發(fā)兩個(gè)人思辨,效果會(huì)比一個(gè)反思更好。
Q6:多個(gè) Agent,每個(gè)Agent 里面有自己的 prompt,還有一些相關(guān)的設(shè)計(jì)。一是關(guān)于 prompt 內(nèi)容的結(jié)構(gòu),二是 prompt 的內(nèi)容,應(yīng)該是跟領(lǐng)域或者您現(xiàn)在嘗試的結(jié)構(gòu)或者體系是有關(guān)系的。這部分是不是做了很多的嘗試?
A6:Prompt 針對(duì)不同模型和不同的訓(xùn)練數(shù)據(jù)是不一樣的。但 prompt 也會(huì)有一定套路,比如首先給背景、目標(biāo)、聽眾,然后明確輸出結(jié)果等等。
Q7:在這種套路下,每次出來的結(jié)果差別大嗎?
A7:大模型運(yùn)行多次的結(jié)果肯定是不一樣的。當(dāng)然你可以調(diào)節(jié),讓它盡可能別發(fā)散,那就是一個(gè)發(fā)散創(chuàng)新和不發(fā)散之間度的平衡,但即使不一樣,也可以通過正則等抽出來一些核心關(guān)鍵點(diǎn)。
Q8:我們?cè)O(shè)計(jì)了多個(gè) Agent 和不同的 prompt 結(jié)構(gòu),那是我們基于當(dāng)前的 LLM 的底座的能力去設(shè)計(jì)的,會(huì)不會(huì)隨著 LLM 技術(shù)的發(fā)展,我們?cè)谝郧暗?Agent 基礎(chǔ)上面做的內(nèi)容和生態(tài)就沒辦法繼續(xù)了?
A8:隨著各項(xiàng)技術(shù)的發(fā)展,原來代碼肯定是要調(diào)整的,這是必然的。
Q9:長(zhǎng)期來說,我們當(dāng)前的工作是起個(gè)大早,是不是做了很多工作都是沒有意義的?
A9:行業(yè)最后會(huì)積累下來一些不變的東西,比如沉淀下來的數(shù)據(jù)、行業(yè)知識(shí)經(jīng)驗(yàn)庫(kù),還有工具,當(dāng)你有了這些東西,有了知識(shí)和行業(yè) know how,有了數(shù)據(jù)和工具,那么未來模型改變,我們也能夠快速改造出一套新的系統(tǒng)。系統(tǒng)本身的價(jià)值遠(yuǎn)不如其背后的行業(yè)優(yōu)質(zhì)數(shù)據(jù)的價(jià)值更大。






























