企業(yè)AI Agent如此困難的真正原因并不是人工智能

演示讓AIAgent看起來毫不費(fèi)力。但真正的痛苦始于演示之后,當(dāng) AI 代理、工作流程、遺留系統(tǒng)和評估開始發(fā)揮作用時(shí)。
為什么現(xiàn)在這很重要
智能助理隨處可見。演示視頻充斥著各大流行媒體。供應(yīng)商承諾推出“自動(dòng)輔助駕駛”,讓你在喝拿鐵咖啡的同時(shí)就能管理你的整個(gè)部門。而且,說實(shí)話,這些原型相當(dāng)不錯(cuò)。
但如果你曾經(jīng)嘗試過從幻燈片到實(shí)際生產(chǎn),你就會知道:人工智能并非最難的部分。模型正在快速改進(jìn),調(diào)用 API 也并非火箭科學(xué)。真正的障礙來自更古老、更復(fù)雜、更深刻的人性。
當(dāng)企業(yè)在代理上遇到阻礙時(shí),他們會遇到以下困境:
- 到處都能看到AIAgent(這不該是AI的事)。
- 定義什么應(yīng)該自動(dòng)化(工作流程清晰)。
- 與現(xiàn)有系統(tǒng)(遺留系統(tǒng)和 API)集成。
- 證明其可靠運(yùn)行(評估和監(jiān)控)。
讓我們來分析一下。
真正困難的是什么
架構(gòu)、框架、內(nèi)存、多模態(tài)和實(shí)時(shí)性都很重要。這些都很重要!但與三大難題相比,這些都是可以解決的工程問題。
混亂源于人員、流程和老舊基礎(chǔ)設(shè)施的協(xié)調(diào)。這正是企業(yè)項(xiàng)目成敗的關(guān)鍵所在。
障礙#1 — 隨處可見的Agent(不該做的事)
首先,有一件事值得大聲說出來:你不需要到處都使用 Agentic 系統(tǒng)。事實(shí)上,許多企業(yè)問題可以用更簡單、更穩(wěn)固的方法更好地解決:
- 經(jīng)典代碼——如果流程重復(fù)且定義明確,則腳本或服務(wù)將比代理運(yùn)行得更快、更便宜、更可靠。
- 傳統(tǒng)機(jī)器學(xué)習(xí)——當(dāng)任務(wù)是關(guān)于結(jié)構(gòu)化數(shù)據(jù)的預(yù)測時(shí),回歸或分類器通常優(yōu)于推理循環(huán)。
- 圖形界面和工作流引擎——有時(shí)真正需要的是清晰度和可用性;在 UI 中映射流程可以解決的不僅僅是增加自主性。
- 簡單的 LLM 調(diào)用——在很多情況下,幾個(gè)精心提示的 API 調(diào)用即可提供所需的所有“智能”,而無需編排開銷。
代理最適合處理那些復(fù)雜、多步驟、動(dòng)態(tài)的工作流程,因?yàn)殪`活性至關(guān)重要。對于其他所有情況,選擇合適的工具來完成任務(wù)可以避免額外的成本、脆弱性和集成難題。
障礙#2——工作流程定義(內(nèi)容)
事實(shí)是:企業(yè)很少有清晰的工作流程。
流程存在于人們的頭腦中。異常會不斷累積。合規(guī)性會增加隱藏的步驟。當(dāng)你問“客服人員到底應(yīng)該處理什么?”時(shí),你已經(jīng)陷入了永無止境的會議、過時(shí)的規(guī)范以及諸如“哦,但對于客戶 X,我們的做法不同”之類的旁白之中。
這就是為什么工作流程現(xiàn)代化是首要的:
- 與企業(yè)坐在一起,繪制工作流程圖,詳細(xì)說明采取的每個(gè)行動(dòng)、由誰執(zhí)行以及手動(dòng)程度如何。
- 闡明什么可以實(shí)現(xiàn)自動(dòng)化、如何實(shí)現(xiàn)自動(dòng)化,并非所有事物都需要 Agentic、什么仍保持人性化以及它們?nèi)绾蜗嗷リP(guān)聯(lián)。
- 記錄混亂的現(xiàn)實(shí),展示工作流程并進(jìn)行驗(yàn)證。
如果沒有這些基礎(chǔ)工作,您的代理人將會:
- 把錯(cuò)誤的事情自動(dòng)化。
- 使一半的事情自動(dòng)化并停滯。
- 或者被那些本應(yīng)幫助的人悄悄忽視。
障礙#3 — 與現(xiàn)有系統(tǒng)的集成(方法)
一旦您知道要自動(dòng)化什么,您就會面臨第三個(gè)障礙:集成到已經(jīng)存在的系統(tǒng)。
- 更糟糕的是——大多數(shù)系統(tǒng)在設(shè)計(jì)時(shí)根本沒有考慮過代理。很多系統(tǒng)甚至在設(shè)計(jì)時(shí)都沒有考慮過 API。
- 需要脆弱連接器的傳統(tǒng) ERP。
- 具有半記錄端點(diǎn)的CRM 或票務(wù)系統(tǒng)。
- 十年前用框架編寫的內(nèi)部應(yīng)用程序現(xiàn)在已無人再觸及。
- 身份驗(yàn)證方案、基于角色的訪問、合規(guī)性限制。
- 后端系統(tǒng)的工作流程非常復(fù)雜,您需要 3 天的時(shí)間才能了解它的用途。
集成不僅僅是“連接到 API”。它還涉及數(shù)十年的技術(shù)債務(wù)、所有權(quán)孤島和脆弱的依賴關(guān)系。
這就是為什么一個(gè)在全新應(yīng)用棧上順利運(yùn)行的演示代理在現(xiàn)實(shí)世界中突然崩潰的原因。它必須與多年來不斷打補(bǔ)丁和定制的系統(tǒng)進(jìn)行通信。
在企業(yè)現(xiàn)實(shí)中,集成等于:
- 查找遺留系統(tǒng)工作流程及其使用方法。
- 讓系統(tǒng)專家來幫助我們(他們沒有時(shí)間?。?/span>
- 在新舊數(shù)據(jù)格式之間進(jìn)行轉(zhuǎn)換。
- 處理速率限制和可靠性問題。
- 與 IT/安全團(tuán)隊(duì)協(xié)商訪問權(quán)限(有時(shí)是最困難的部分)。
直到越過這個(gè)障礙,代理才會停止,停留在原型循環(huán)中。
障礙#4 — 評估(證明)
即使您確定了工作流程并成功完成集成,您仍會遇到第四個(gè)問題:您如何知道它有效?
代理中的評估是出了名的不順利:
- 任務(wù)級指標(biāo):代理是否按照定義完成了工作流程?完成率是多少?誤報(bào)率是多少?
- 代理級指標(biāo):代理是否遵循工作流程并生成了正確的計(jì)劃?我們是否捕獲了所有流程中的錯(cuò)誤并將其轉(zhuǎn)交給人工處理?
- 業(yè)務(wù)指標(biāo):它是否節(jié)省了時(shí)間、降低了成本或提高了準(zhǔn)確性?
- 安全指標(biāo):它是否避免了幻覺、違反政策、違反合規(guī)性,并且基本上沒有做我們不希望它做的事情?
通常的機(jī)器學(xué)習(xí)技巧在基準(zhǔn)數(shù)據(jù)集上提高準(zhǔn)確率并不能解決問題。每個(gè)企業(yè)都有獨(dú)特的需求。
這里的實(shí)用模式包括:
- 評估數(shù)據(jù)集:精心挑選的輸入以及預(yù)期的代理規(guī)劃和輸出。
- 真正的代理評估:不僅評估結(jié)果,還評估代理計(jì)劃和授權(quán)。
- 影子模式:代理在完全控制人類之前與人類一起奔跑。
- 持續(xù)監(jiān)控:跟蹤一段時(shí)間內(nèi)的漂移、性能和回歸。
如果沒有嚴(yán)格評估,代理要么在演示中看起來很神奇,但在生產(chǎn)中卻悄無聲息地失敗,或者更糟的是,他們會在無人注意的情況下破壞一些關(guān)鍵的東西。
結(jié)論——為什么AI代理在企業(yè)中會失敗
讓我們回顧一下。
企業(yè)代理最難的部分不是人工智能本身,而是:
- 代理幻影(不該做的事):在沒有必要的地方隨處看到代理。
- 清晰度(什么):定義業(yè)務(wù)工作流程,在需要的地方進(jìn)行現(xiàn)代化。
- 集成(方法):插入遺留系統(tǒng)、脆弱的 API 和數(shù)十年的技術(shù)債務(wù)。
- 評估(證明):不斷評估代理以建立信任。
忽略這些,你的“自主輔助駕駛”就會一直困在原型的煉獄里。擁抱這些,你就能把人工智能從光鮮亮麗的演示變成企業(yè)級資產(chǎn)。
教訓(xùn)是什么?不要把代理的采用視為一個(gè)人工智能項(xiàng)目,而要將其視為一個(gè)工作流程+集成現(xiàn)代化項(xiàng)目,從第一天起就內(nèi)置評估。























