MCP:AI 時(shí)代的工具接口標(biāo)準(zhǔn)?
1.前言
自從 OpenAI 在 2023 年推出函數(shù)調(diào)用(Function Calling),我一直思考,咋能真正解鎖 AI Agent與工具的生態(tài)系統(tǒng)。隨基礎(chǔ)模型越來(lái)越智能,AI Agent與外部工具、數(shù)據(jù)和 API 的交互方式卻變得越來(lái)越碎片化——開(kāi)發(fā)者需針對(duì)每一個(gè)系統(tǒng)單獨(dú)編寫(xiě)業(yè)務(wù)邏輯,讓Agent能夠適配不同環(huán)境。
2.標(biāo)準(zhǔn)化
顯然,我們需要一個(gè)標(biāo)準(zhǔn)化的接口來(lái)執(zhí)行任務(wù)、獲取數(shù)據(jù)并調(diào)用工具。在互聯(lián)網(wǎng)時(shí)代,API 讓不同軟件之間可以相互通信,成為了軟件的通用語(yǔ)言。但對(duì) AI 模型,目前還缺這樣的標(biāo)準(zhǔn)。
2024 年 11 月,**模型上下文協(xié)議(Model Context Protocol,MCP)**發(fā)布,迅速引起關(guān)注,被認(rèn)為可能成為這一問(wèn)題的解決方案。本文探討:
- MCP 是什么?
- 它如何改變 AI 與工具的交互方式?
- 開(kāi)發(fā)者已經(jīng)用 MCP 構(gòu)建了哪些應(yīng)用?
- MCP 仍然面臨哪些挑戰(zhàn)?
3.什么是 MCP
MCP 是一種開(kāi)放協(xié)議,旨在讓不同系統(tǒng)能夠?yàn)?AI 模型提供可泛化的上下文信息。它規(guī)定了AI Agent如何調(diào)用外部工具、獲取數(shù)據(jù),并與服務(wù)交互。
Resend MCP 服務(wù)器可以同時(shí)與多個(gè) MCP 客戶(hù)端交互,使其具備郵件發(fā)送能力。MCP 靈感源于語(yǔ)言服務(wù)器協(xié)議(LSP,Language Server Protocol)。在 LSP 中,當(dāng)用戶(hù)在代碼編輯器中輸入時(shí),客戶(hù)端會(huì)向語(yǔ)言服務(wù)器請(qǐng)求自動(dòng)補(bǔ)全建議或代碼診斷。
MCP進(jìn)一步拓展,采用面向 AI Agent的執(zhí)行模式:
- LSP 主要是被動(dòng)的,只會(huì)在 IDE 發(fā)請(qǐng)求時(shí)提供反饋
- MCP 則支持 AI Agent自主決策,可以基于上下文信息選擇合適的工具,并決定調(diào)用順序,實(shí)現(xiàn)復(fù)雜任務(wù)的自動(dòng)化
- MCP 還支持“人類(lèi)參與(human-in-the-loop)”,允許人在關(guān)鍵節(jié)點(diǎn)提供額外信息或批準(zhǔn)操作
3.MCP目前的熱門(mén)應(yīng)用
如有夠多的 MCP 服務(wù)器,用戶(hù)就能將任何 MCP 客戶(hù)端變成“萬(wàn)能應(yīng)用”。
3.1 Cursor
作為一個(gè)代碼編輯器,同時(shí)也是高質(zhì)量 MCP 客戶(hù)端。安裝不同 MCP 服務(wù)器,可變身為:
- Slack 客戶(hù)端(連接 Slack MCP 服務(wù)器)
- 郵件發(fā)送工具(連接 Resend MCP 服務(wù)器)
- AI 圖像生成器(連接 Replicate MCP 服務(wù)器)
更強(qiáng)大的,用戶(hù)可組合多個(gè) MCP 服務(wù)器,解鎖新應(yīng)用場(chǎng)景。如Cursor中,用戶(hù)可:
- 使用前端 UI 生成 MCP 服務(wù)器,自動(dòng)創(chuàng)建網(wǎng)頁(yè)界面
- 讓 AI Agent調(diào)用圖像生成 MCP 服務(wù)器,為網(wǎng)頁(yè)自動(dòng)生成一張配圖
這種跨工具協(xié)作的能力,正是 MCP 帶來(lái)突破。
4.核心應(yīng)用方向
4.1 面向開(kāi)發(fā)者的工作流優(yōu)化
對(duì)開(kāi)發(fā)者,MCP 一大價(jià)值是減少切換工具的時(shí)間。
開(kāi)發(fā)者的痛點(diǎn)
“我不想為做某個(gè)任務(wù)而離開(kāi) IDE?!?/p>
MCP 服務(wù)器正滿(mǎn)足需求,如:
- Postgres MCP 服務(wù)器 → 讓開(kāi)發(fā)者直接在 IDE 里執(zhí)行 SQL 查詢(xún),而無(wú)需打開(kāi)數(shù)據(jù)庫(kù)管理界面
- Upstash MCP 服務(wù)器 → 讓開(kāi)發(fā)者在 IDE 里管理緩存索引
- Browsertools MCP 服務(wù)器 → 讓代碼Agent訪問(wèn)瀏覽器控制臺(tái)日志,輔助調(diào)試
MCP 還能幫助 AI Agent動(dòng)態(tài)獲取代碼相關(guān)的上下文,如:
- 爬取網(wǎng)頁(yè)內(nèi)容,為Agent提供實(shí)時(shí)信息
- 通過(guò) API 自動(dòng)生成 MCP 服務(wù)器,讓 AI Agent能直接訪問(wèn)工具,而無(wú)需手動(dòng)集成
即開(kāi)發(fā)者可更少寫(xiě)模板代碼,更多專(zhuān)注于業(yè)務(wù)邏輯。
4.2 全新的 AI 交互體驗(yàn)
盡管 MCP 目前在開(kāi)發(fā)者社區(qū)最受歡迎,但它的潛力遠(yuǎn)不限于技術(shù)領(lǐng)域。如:
- Claude Desktop → 讓非技術(shù)用戶(hù)也能輕松使用 MCP 服務(wù)器,如營(yíng)銷(xiāo)文案生成、設(shè)計(jì)、客服等任務(wù)
- Highlight MCP 客戶(hù)端 → 允許用戶(hù)通過(guò) @ 命令調(diào)用 MCP 服務(wù)器,將生成內(nèi)容直接輸入到任何應(yīng)用
- Blender MCP 服務(wù)器 → 讓不會(huì)建模的用戶(hù),通過(guò)自然語(yǔ)言描述 3D 模型,AI Agent自動(dòng)生成對(duì)應(yīng)的圖像或動(dòng)畫(huà)
社區(qū)還正在開(kāi)發(fā)適用于 Unity 和 Unreal Engine 的 MCP 服務(wù)器,AI 生成 3D 內(nèi)容的流程正在變得越來(lái)越完善。
5.MCP現(xiàn)狀
MCP生態(tài)仍處早期階段,主要趨勢(shì):
- 高質(zhì)量的 MCP 客戶(hù)端仍以開(kāi)發(fā)工具為主,但未來(lái)會(huì)有更多面向商業(yè)場(chǎng)景客戶(hù)端
- 大多數(shù) MCP 服務(wù)器是本地優(yōu)先(local-first)的,未來(lái)可能會(huì)向遠(yuǎn)程 MCP 服務(wù)器擴(kuò)展
- MCP 市場(chǎng)和托管解決方案正在興起,如 Mintlify 的 MCP 市場(chǎng)、Smithery 和 OpenTools,讓開(kāi)發(fā)者可以更容易發(fā)現(xiàn)和共享 MCP 服務(wù)器
6.MCP的挑戰(zhàn)
6.1 托管與多租戶(hù)支持
目前MCP服務(wù)器主要1對(duì)1,未來(lái)需支持多個(gè)用戶(hù)同時(shí)訪問(wèn),尤其SaaS場(chǎng)景。
6.2 身份驗(yàn)證(Authentication)
MCP 目前沒(méi)有標(biāo)準(zhǔn)的身份驗(yàn)證機(jī)制,開(kāi)發(fā)者需要自己實(shí)現(xiàn) OAuth 或 API 令牌管理
6.3 權(quán)限管理(Authorization)
MCP 目前的權(quán)限是基于會(huì)話(huà)的,未來(lái)需要更細(xì)粒度的訪問(wèn)控制。
6.4 網(wǎng)關(guān)(Gateway)
未來(lái) MCP 可能需要一個(gè)集中式網(wǎng)關(guān),類(lèi)似 API 網(wǎng)關(guān),管理身份驗(yàn)證、授權(quán)、流量控制等功能
6.5 MCP 服務(wù)器發(fā)現(xiàn)與注冊(cè)機(jī)制
MCP 服務(wù)器目前需要手動(dòng)配置,未來(lái)可能會(huì)有一個(gè)類(lèi)似 npm 或 RapidAPI 的 MCP 服務(wù)器注冊(cè)中心,讓 AI Agent自動(dòng)發(fā)現(xiàn)并集成工具。
7.MCP未來(lái):AI Agent的 API 標(biāo)準(zhǔn)?
MCP目前像2010時(shí)的 API 生態(tài)——新穎但仍處早期階段。若MCP 成為 AI Agent的標(biāo)準(zhǔn)接口,會(huì)咋樣?
- 工具競(jìng)爭(zhēng)力將取決于 AI Agent能否發(fā)現(xiàn)并調(diào)用它,而不僅是 API 設(shè)計(jì)是否優(yōu)秀。
- 定價(jià)模式可能改變,AI Agent可能會(huì)動(dòng)態(tài)選擇最便宜、最快、最相關(guān)的工具,而不是僅僅依賴(lài)市場(chǎng)占有率。
- 文檔將變得至關(guān)重要,因?yàn)?AI Agent需要機(jī)器可讀的格式來(lái)理解 MCP 服務(wù)器的功能。
- API 將不再是終點(diǎn),開(kāi)發(fā)者需要圍繞具體場(chǎng)景構(gòu)建 MCP 服務(wù)器,而不是簡(jiǎn)單地開(kāi)放 API 端點(diǎn)。
MCP 正在重塑 AI Agent生態(tài),但它的未來(lái)取決于開(kāi)發(fā)者如何解決當(dāng)前的基礎(chǔ)問(wèn)題。如果一切順利,MCP 可能會(huì)成為AI Agent調(diào)用工具的默認(rèn)接口,解鎖全新的自主、多模態(tài)、深度集成的 AI 體驗(yàn)。
本文轉(zhuǎn)載自??JavaEdge??,作者:JavaEdge
