1個實(shí)戰(zhàn)案例搞懂AI大模型的"萬能手"MCP協(xié)議,微軟也下場了
最近爆火的 MCP(Model Context Protocol,模型上下文協(xié)議) 是 Anthropic 公司推出的一種開放協(xié)議。
目的是讓 AI 智能體(如 Claude、ChatGPT 等) 能像“萬能插座”一樣,輕松連接各種外部工具和數(shù)據(jù)源,比如日歷、數(shù)據(jù)庫、郵件系統(tǒng)、代碼編輯器等。
圖片
MCP 本質(zhì)就是一個標(biāo)準(zhǔn)。舉一個最簡單的例子,大家去買電器的時候,完全不用擔(dān)心買來的電器插不到自己家的插座上。因為所有插頭和插座生產(chǎn)商遵循的都是同一套標(biāo)準(zhǔn)。
統(tǒng)一標(biāo)準(zhǔn),意味著可以大大提高開發(fā)效率,同時降低開發(fā)成本。
在沒有MCP情況下,我們需要讓大模型使用日歷、數(shù)據(jù)庫、郵件系統(tǒng),需要自己對接這些軟件,編寫不同的API。
圖片
但MCP可以幫你屏蔽各種軟件API差異,給你提供一個統(tǒng)一的接口,你只管調(diào)用就可以,大大降低對接不同軟件的難度。
舉一個更實(shí)際的例子,之前給大家分享過一個自動使用瀏覽器完成簡單任務(wù)的開源Agent——browser-use
圖片
這個開源項目自己實(shí)現(xiàn)了一套操作瀏覽器的函數(shù),比如:打開網(wǎng)站(go_to_url)、返回上一頁(go_back)、點(diǎn)擊頁面按鈕(click_element)、頁面文本框輸入文字(input_text)等一系列動作。
圖片
不但代碼復(fù)雜,而且還要對瀏覽器內(nèi)部機(jī)制有一定的了解,如果是個人開發(fā)者想要實(shí)現(xiàn)這樣一個Agent,難度可想而知。
那讓我們再來看看使用 MCP 后變得有多簡單。
下面介紹一個微軟剛剛開源的可操作瀏覽器的MCP服務(wù)器——microsoft/playwright-mcp
圖片
同樣也提供了一些操作瀏覽器的工具。
圖片
我們不需要關(guān)心這些工具內(nèi)部實(shí)現(xiàn)有多復(fù)雜,只需要會調(diào)用這些工具完成任務(wù)即可。
相比于 browser-use 需要自己編寫一個個瀏覽器操作函數(shù),部署 playwright-mcp MCP服務(wù)器直接調(diào)用當(dāng)然是效率最高的。
大模型技術(shù)真實(shí)日新月異,每隔一段時間就會出現(xiàn)炸裂的模型或工具。