為什么你的 AI 數(shù)據(jù)戰(zhàn)略應(yīng)該包含 MCP

隨著代理系統(tǒng)變得越來越復(fù)雜,企業(yè)能力在這些系統(tǒng)中作為工具出現(xiàn),建立明確且一致的規(guī)則對于自主工作流程的成功至關(guān)重要。
模型上下文協(xié)議 (MCP) 為代理、LLM 和企業(yè)系統(tǒng)提供通用語言。將 MCP 納入 AI 數(shù)據(jù)戰(zhàn)略的企業(yè)將能夠構(gòu)建新功能,確保信任和可審計性,并適應(yīng)快速發(fā)展的創(chuàng)新。競爭優(yōu)勢將源于周到的設(shè)計、強大的可操作性和學(xué)習(xí)意愿。
這篇文章介紹了 MCP 作為 AI 原生集成標(biāo)準(zhǔn)的工作原理、其主要特性、與 API 的關(guān)系、相對于 RAG 系統(tǒng)的優(yōu)勢、實施策略以及組織的運營考慮因素。
什么是 MCP?它為何重要?
MCP 于 2024 年底推出,是一種開放的 AI 原生協(xié)議,用于描述外部工具、函數(shù)、API 和數(shù)據(jù)集,使 LLM 能夠自行決定如何以及何時使用它們。它基于數(shù)十年 API、SOAP、REST 和 OpenAPI/Swagger 的經(jīng)驗教訓(xùn)——但至關(guān)重要的是,它是為機器而非人類的消費和推理而設(shè)計的。
MCP 支持功能發(fā)現(xiàn),代理或 LLM 可以確定哪些操作是可行的,以及成功執(zhí)行這些操作所需的上下文。它通過詳細(xì)的描述提供豐富的語義,幫助 LLM 理解如何使用、何時以及為何使用一項功能。MCP 通過一致的接口公開各種資源(API、數(shù)據(jù)庫和內(nèi)部工具),從而提供一致性。它還通過提供一個抽象層來支持可組合性,該抽象層用于在復(fù)雜的代理工作流中連接、組合和編排服務(wù)和數(shù)據(jù)源。
示例:Excel 即服務(wù)
假設(shè)一位業(yè)務(wù)用戶想要通過 AI 助手操作 Excel 電子表格中的數(shù)據(jù)。傳統(tǒng)方法需要專門構(gòu)建的 API 連接器或自定義提示“配方”,用于執(zhí)行每個操作,例如添加行、重新計算列或設(shè)置格式。這種集成非常繁瑣。
借助 MCP,Excel 服務(wù)可以通過 MCP 公開其功能(包括其存儲的數(shù)據(jù)類型和提供的功能)。代理可以讀取這些信息,推斷可用的操作,并執(zhí)行諸如“添加季度增長率列”之類的任務(wù),而無需進行自定義集成工作。
MCP 與 API 的關(guān)系和區(qū)別
MCP 可以被視為一次進化的飛躍。傳統(tǒng)的 API 充當(dāng)系統(tǒng)交互的“名詞和動詞”,而 MCP 不僅闡明了存在哪些操作,還闡明了如何以豐富、靈活的方式(適合 AI 代理)使用它們。
API 和 MCP 都提供了定義客戶端可以對系統(tǒng)執(zhí)行哪些操作的契約。它們都可以組合起來,以編排更復(fù)雜的工作流程。兩者都依賴于良好的設(shè)計,因為設(shè)計不良的 API 或描述不良的 MCP 端點會導(dǎo)致混亂、功能無法使用或下游問題。
然而,它們之間存在著關(guān)鍵的區(qū)別。API 是為人類開發(fā)人員設(shè)計的,而 MCP 是為能夠讀取并“推理”詳細(xì)描述和上下文的 AI 模型設(shè)計的。API 通常需要手動編寫,而 MCP 則明確面向能夠?qū)崟r決定使用哪些工具以及如何使用的代理推理系統(tǒng)。MCP 可以輕松地以自由形式的敘述(而不僅僅是形式參數(shù))來描述語義關(guān)系和上下文——這有助于 LLM 驅(qū)動的決策。
假設(shè)用例:ERP 集成
一家零售商的 ERP 系統(tǒng)包含數(shù)十個 API(庫存、定價、訂單)。以前,開發(fā)人員必須學(xué)習(xí)每個 API,閱讀文檔,編寫代碼,并處理各種邊緣情況。
通過 MCP,一個描述良好的界面即可展現(xiàn)業(yè)務(wù)優(yōu)先的功能:“檢索當(dāng)前庫存水平”、“檢查缺貨訂單”、“將價格上調(diào) 5%”。負(fù)責(zé)“準(zhǔn)備低庫存警報報告”的 LLM 代理可以使用語義描述來發(fā)現(xiàn)、組合和排序這些功能,即使這些功能是跨 API、數(shù)據(jù)庫或遺留系統(tǒng)實現(xiàn)的。
超越檢索增強生成:人工智能應(yīng)用集成的下一步
檢索增強生成 (RAG)幫助模型在推理時檢索外部信息,并通過最新或特定于企業(yè)的上下文來增強其響應(yīng)能力。然而,RAG 主要關(guān)注的是數(shù)據(jù)檢索,而非操作。
MCP 更進一步,提供了工具契約,使 LLM 不僅能夠查找信息,還能調(diào)用操作。它通過描述提供語義指導(dǎo),闡明工具的功能、使用時機、副作用以及預(yù)期的輸入/輸出類型。MCP 支持統(tǒng)一的編排,使 LLM 能夠以單一、一致的方式理解后端并與之交互,無論后端是 REST API、直接 SQL 接口還是其他接口。
示例:自動化支出管理
想要實現(xiàn)月度費用審批自動化的企業(yè)可以使用 LLM 代理,該代理會檢查已提交的請求(使用 RAG),然后使用 MCP 公開的 SQL 數(shù)據(jù)庫工具來審計預(yù)算消耗,在發(fā)現(xiàn)異常時調(diào)用 MCP 的“通知管理器”功能,并在 MCP 公開的 ERP 系統(tǒng)中記錄記錄。該代理無需使用脆弱的腳本或點對點集成,而是在豐富的 MCP 描述指導(dǎo)下動態(tài)導(dǎo)航功能。
MCP設(shè)計和操作化的重要性
對于 API 而言,成功通常取決于清晰、以開發(fā)者為中心的設(shè)計。而使用 MCP,您編寫的模型會關(guān)注每一個字詞。LLM 能夠處理詳盡的文檔、示例和細(xì)微差別,因此,全面性和清晰度會帶來回報。
一個好的薪資 MCP 端點不僅僅是被描述為“update_salary”。其文檔解釋道:“使用此功能調(diào)整員工薪酬。典型場景:年度加薪、特別獎金。要求:employee_id、new_salary、reason。觸發(fā)通知給人力資源和財務(wù)部門?!?/span>
一個糟糕的例子是“可調(diào)用對象:update(eid,val)”,它沒有提供任何上下文,可能會被 LLM(或人類)誤用或忽略。
陷阱:糟糕的設(shè)計會延續(xù)下去
與 API 一樣,后端結(jié)構(gòu)與業(yè)務(wù)流程之間缺乏一致性會導(dǎo)致混亂。將原始數(shù)據(jù)庫模式表達為 MCP 端點,或用技術(shù)術(shù)語公開每個方法,都違背了初衷。LLM 可以彌補一些歧義,但無法完全克服清晰度或業(yè)務(wù)上下文的缺失。
資源考慮
AI 操作并非免費:每個令牌和每次調(diào)用都需要計算資源,進而也需要資金。如果客服人員天真地重復(fù)或過度調(diào)用,后端可能會不堪重負(fù),預(yù)算也可能超支。
緩解策略包括使用精確的、以任務(wù)為中心的 MCP 端點,在 MCP 描述中指示成本、副作用或推薦的使用模式,并根據(jù)需要實施緩存或限制,同時將這些限制告知代理。
新的測試、監(jiān)控和管理模式
測試確定性 API 很簡單,但由 MCP 支持的代理 AI 引入了可變性:相同的請求可能會根據(jù)上下文、負(fù)載或細(xì)微的提示差異產(chǎn)生不同的工具鏈。
MCP 世界中的 QA 包括合成任務(wù)生成以創(chuàng)建代表性任務(wù)并自動化測試運行、邊緣案例分析以監(jiān)控?zé)o效的工具選擇或資源問題,以及凍干模式以將可靠的工具鏈“凍結(jié)”為固定序列或新的 MCP 端點。
自動化的連續(xù)體:代理和程序
并非所有問題都需要自由形式的代理編排。許多企業(yè)工作流程一旦發(fā)現(xiàn),最好進行硬編碼,以提高效率和可預(yù)測性。相同的 MCP 基礎(chǔ)架構(gòu)可以同時支持這兩種方法,在需要的地方提供靈活性,在其他地方提供確定性。
企業(yè)戰(zhàn)略的最終考慮
MCP 屬于 AI 數(shù)據(jù)庫,因為它通過減少逐案定制集成的需要來加速集成,通過詳細(xì)描述的功能來提高透明度和信任度,通過防止“失控”的計算費用來降低成本,并通過帶來適應(yīng)性來確保架構(gòu)的未來性。
可行的步驟包括從小處著手,通過 MCP 公開關(guān)鍵 API 或工具,通過詳細(xì)說明功能使用的原因、時間和后果來進行清晰的設(shè)計,迭代和凍結(jié)成功的工作流程,規(guī)劃包括成本和資源監(jiān)控在內(nèi)的運營,并通過試點和分析進行邊做邊學(xué)。
常見問題
人工智能中的數(shù)據(jù)戰(zhàn)略是什么?
人工智能中的數(shù)據(jù)戰(zhàn)略是指組織如何收集、管理、存儲和使用數(shù)據(jù)來驅(qū)動人工智能系統(tǒng)的全面規(guī)劃。它涵蓋數(shù)據(jù)治理、質(zhì)量控制、集成方法以及像 MCP 這樣的工具,使人工智能系統(tǒng)能夠有效地訪問和使用組織數(shù)據(jù)。良好的人工智能數(shù)據(jù)策略能夠確保人工智能代理能夠發(fā)現(xiàn)、理解并合理利用所有可用的數(shù)據(jù)資源和工具,從而實現(xiàn)業(yè)務(wù)價值。
什么是 AI-first 數(shù)據(jù)策略?
AI 優(yōu)先的數(shù)據(jù)策略優(yōu)先考慮專為 AI 消費而非人類消費而設(shè)計的數(shù)據(jù)系統(tǒng)。它致力于通過實施 MCP 等協(xié)議,使 AI 系統(tǒng)能夠理解上下文、發(fā)現(xiàn)功能并采取適當(dāng)?shù)男袆?,從而使?shù)據(jù)具備 AI 就緒性。這種方法強調(diào)語義豐富性、跨不同數(shù)據(jù)源的一致性以及服務(wù)的可組合性,從而使 AI 代理能夠高效工作,而無需大量的人工干預(yù)或針對每個用例進行自定義集成。
數(shù)據(jù)策略的一個例子是什么?
數(shù)據(jù)策略的一個實際例子是企業(yè)實施 MCP 來統(tǒng)一對其各個系統(tǒng)的訪問。例如,零售商可能會制定一個全面的數(shù)據(jù)策略,該策略包括:
- 通過 MCP 接口公開庫存、定價和訂單系統(tǒng)
- 為每項功能創(chuàng)建清晰的語義描述
- 對人工智能代理交互實施適當(dāng)?shù)臏y試和監(jiān)控
- 建立數(shù)據(jù)訪問和操作的治理協(xié)議
- 開發(fā)成本控制機制以防止失控的計算費用
- 創(chuàng)建一個流程來識別成功的 AI 工作流程,并對其進行“冷凍干燥”以提高效率
- 構(gòu)建具有一致元數(shù)據(jù)標(biāo)準(zhǔn)的集中式數(shù)據(jù)湖
- 在信息進入人工智能系統(tǒng)之前建立數(shù)據(jù)質(zhì)量控制流程
這種方法可以使企業(yè)逐步構(gòu)建人工智能功能,同時保持對代理與關(guān)鍵業(yè)務(wù)系統(tǒng)交互方式的控制。































