關(guān)于大模型應(yīng)用協(xié)議的發(fā)布——MCP和A2A協(xié)議的出現(xiàn)意味著什么? 原創(chuàng)
“ 智能體是大模型應(yīng)用的未來(lái),而協(xié)議卻是決定大模型應(yīng)用的行業(yè)標(biāo)準(zhǔn)。”
2024年是大模型應(yīng)用探索的元年,而隨著大家對(duì)大模型應(yīng)用的探索,大模型被應(yīng)用到越來(lái)越多的場(chǎng)景;但同時(shí)也面臨著各種各樣的問(wèn)題。
特別是在智能體方面的應(yīng)用探索,面臨著各種各樣的問(wèn)題;而其中目前最頭疼的無(wú)非就是各家大模型公司沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),關(guān)于智能體的技術(shù)實(shí)現(xiàn)也各式各樣;而這直接阻擋了大模型應(yīng)用方面的進(jìn)展。
而解決這個(gè)問(wèn)題最好的辦法是什么?
那就是制定行業(yè)標(biāo)準(zhǔn),統(tǒng)一度量衡;就類似于網(wǎng)絡(luò)技術(shù)發(fā)展的初期,制定了計(jì)算機(jī)網(wǎng)絡(luò)模型,以及每層網(wǎng)絡(luò)模型的協(xié)議;因此,才有了今天的互聯(lián)網(wǎng)。
當(dāng)然,目前關(guān)于大模型方面的協(xié)議還處于初草階段,可能還不是很完善;但有了好的開(kāi)始就說(shuō)明成功了一半。
所以,今天我們就來(lái)介紹一下關(guān)于大模型應(yīng)用的兩個(gè)新的協(xié)議或者說(shuō)標(biāo)準(zhǔn)——MCP和A2A。
大模型應(yīng)用協(xié)議
MCP協(xié)議
關(guān)于MCP協(xié)議在之前的文章中已經(jīng)有過(guò)簡(jiǎn)單的介紹,其目的就是統(tǒng)一大模型調(diào)用外部工具的標(biāo)準(zhǔn);比如說(shuō)大模型從外部數(shù)據(jù)庫(kù)中獲取數(shù)據(jù),調(diào)用第三方接口實(shí)現(xiàn)一些功能等等。
而面臨著復(fù)雜的第三方接口和各種中間服務(wù),以及安全,加解密等問(wèn)題;也為了促進(jìn)大模型行業(yè)應(yīng)用的發(fā)展,因此怎么把大模型與現(xiàn)有系統(tǒng)的能力結(jié)合起來(lái)就成為了一個(gè)急需解決的問(wèn)題。
而這就是MCP協(xié)議誕生的主要原因。
MCP協(xié)議全稱是模型上下文協(xié)議(Model Context Protocol),簡(jiǎn)稱MCP。
MCP協(xié)議是由美國(guó)前OpenAI成員創(chuàng)立的Anthropic公司所發(fā)布的一篇論文—— Introducing the Model Context Protocol。
Introducing the Model Context Protocol文章地址如下:
MCP (Model Context Protocol,模型上下文協(xié)議)定義了應(yīng)用程序和 AI 模型之間交換上下文信息的方式。這使得開(kāi)發(fā)者能夠以一致的方式將各種數(shù)據(jù)源、工具和功能連接到 AI 模型(一個(gè)中間協(xié)議層),就像 USB-C 讓不同設(shè)備能夠通過(guò)相同的接口連接一樣。MCP 的目標(biāo)是創(chuàng)建一個(gè)通用標(biāo)準(zhǔn),使 AI 應(yīng)用程序的開(kāi)發(fā)和集成變得更加簡(jiǎn)單和統(tǒng)一。
A2A協(xié)議
而A2A協(xié)議的全稱是Agent-to-Agent,也就是智能體之間的通訊協(xié)議;其目的是整合不同智能體的功能,通過(guò)A2A協(xié)議就可以串聯(lián)多個(gè)智能體來(lái)完成一個(gè)任務(wù)。
正如上面MCP協(xié)議中所介紹的那樣,智能體是由大模型+其它三方接口或工具構(gòu)成的一個(gè)能夠獨(dú)立完成某種任務(wù)或功能的復(fù)合體;比如說(shuō)使用大模型+地圖接口就可以實(shí)現(xiàn)一個(gè)路線規(guī)劃的智能體;而大模型+美團(tuán)接口就可以實(shí)現(xiàn)一個(gè)具備本地生活功能的智能體。
而如果要想讓一個(gè)智能體,同時(shí)能夠進(jìn)行旅游規(guī)劃,路線規(guī)劃以及訂票,訂酒店的能力;這時(shí)有兩種實(shí)現(xiàn)方式,一是實(shí)現(xiàn)一個(gè)巨復(fù)雜的智能體,把地圖,票務(wù),酒店等接口全部集成進(jìn)去。
但這樣就面臨著一個(gè)問(wèn)題,那就是大模型存在一定的幻覺(jué)現(xiàn)象,包括在智能體中;其次,根據(jù)軟件的設(shè)計(jì)原則——單一原則;智能體的功能越簡(jiǎn)單越好,因?yàn)楹?jiǎn)單就代表著穩(wěn)定性強(qiáng),不容易出錯(cuò);而復(fù)雜功能可以使用多個(gè)具備不同能力的智能體來(lái)聯(lián)合實(shí)現(xiàn)。
比如說(shuō),以上面的旅游為例;實(shí)現(xiàn)一個(gè)規(guī)劃路線的智能體,再實(shí)現(xiàn)一個(gè)酒店智能體和票務(wù)智能體;這樣通過(guò)三個(gè)智能體之間的組合,就可以實(shí)現(xiàn)我們所需要的功能。
而這就是A2A協(xié)議的作用。
MCP協(xié)議解決了大模型怎么使用外部工具的問(wèn)題;而A2A協(xié)議解決了智能體之間的協(xié)作問(wèn)題。
A2A 基于五個(gè)核心原則:
擁抱智能體能力:支持自然、非結(jié)構(gòu)化的協(xié)作模式。
- 利用現(xiàn)有標(biāo)準(zhǔn):使用 HTTP、Server-Sent Events(SSE) 和JSON-RPC,確保與現(xiàn)有系統(tǒng)的兼容性。
- 默認(rèn)安全:支持企業(yè)級(jí)認(rèn)證和授權(quán),啟動(dòng)時(shí)與OpenAPI保持一致。
- 支持長(zhǎng)期任務(wù):處理從快速任務(wù)到深入研究的任務(wù),提供實(shí)時(shí)反饋、通知和狀態(tài)更新。
- 多模態(tài)支持:支持文本、音頻、視頻流等多模態(tài)通信。
總結(jié)
關(guān)于大模型應(yīng)用協(xié)議的出現(xiàn),意味著大模型的應(yīng)用越來(lái)越多,急需一個(gè)行業(yè)標(biāo)準(zhǔn)來(lái)統(tǒng)一規(guī)范;因此,這也意味著大模型的前景一片光明。
本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires
