智能體的五大商業(yè)用例
AI的下一代已經(jīng)到來(lái),它具有自主性。智能體與聊天機(jī)器人由相同的AI系統(tǒng)提供支持,但可以獨(dú)立行動(dòng)、協(xié)作以實(shí)現(xiàn)更大的目標(biāo),并接管整個(gè)業(yè)務(wù)流程,這項(xiàng)技術(shù)相對(duì)較新,但所有主要參與者都已經(jīng)加入。
去年10月,微軟宣布包括標(biāo)準(zhǔn)銀行、路透社、Virgin Money和蘇黎世保險(xiǎn)在內(nèi)的10萬(wàn)家組織正在使用Copilot Studio,這一數(shù)字是幾個(gè)月前的兩倍。Copilot Studio能夠使企業(yè)構(gòu)建自主智能體,以及其他將CRM系統(tǒng)、HR系統(tǒng)和其他企業(yè)平臺(tái)連接到Copilot的智能體。
在整個(gè)2024年底,微軟繼續(xù)有目的地?cái)U(kuò)展其智能體產(chǎn)品,推出了針對(duì)特定用例的定制智能體,然后在11月,該公司推出了Azure AI Agent Service,這是一項(xiàng)完全托管的服務(wù),可讓企業(yè)快速構(gòu)建、部署和擴(kuò)展智能體。而在AWS上,自2023年以來(lái),Amazon Bedrock Agents就已可用,但在12月,亞馬遜添加了多智能體協(xié)作功能。
主要的企業(yè)軟件供應(yīng)商也在進(jìn)入智能體領(lǐng)域。Salesforce在10月推出了Agentforce,隨后幾個(gè)月推出了Agentforce 2.0。該升級(jí)包括一個(gè)預(yù)建技能和工作流程集成的庫(kù)、對(duì)Slack的支持以及更強(qiáng)的推理能力。
在此之前,ServiceNow于9月宣布了其AI Agents產(chǎn)品,11月推出了針對(duì)客戶服務(wù)管理和IT服務(wù)管理的首批用例。
還有一些純粹的智能體AI平臺(tái)提供商,如CrewAI,以及智能自動(dòng)化提供商,如UiPath,而這僅僅是開始,在1月初發(fā)布的一份報(bào)告中,Accenture預(yù)測(cè),到2030年,智能體將取代人類,成為大多數(shù)企業(yè)系統(tǒng)的主要用戶。在1月KPMG對(duì)100家大型企業(yè)高管的調(diào)查中,12%的公司已經(jīng)部署了智能體,37%的公司處于試點(diǎn)階段,另有51%的公司正在探索其使用,但并非一切順利,因?yàn)橥ㄓ肁I本身還遠(yuǎn)非完美。
“存在幻覺(jué)和偏見(jiàn)的風(fēng)險(xiǎn),”Accenture的首席負(fù)責(zé)AI官Arnab Chakraborty說(shuō),“因此,這不僅僅關(guān)乎用例,還關(guān)乎設(shè)置防護(hù)欄?!敝悄荏w也很難構(gòu)建,且大規(guī)模部署成本高昂。
盡管如此,企業(yè)已經(jīng)在報(bào)告部署智能體用于多個(gè)用例的成功案例。
1. 軟件開發(fā)和IT
去年3月,Cognition發(fā)布了Devin,號(hào)稱是世界上第一個(gè)AI軟件工程師。當(dāng)時(shí),最好的AI在SWE-bench(一個(gè)旨在測(cè)試AI解決真實(shí)世界編碼問(wèn)題能力的挑戰(zhàn)性基準(zhǔn)測(cè)試)上的得分不能超過(guò)5%。Devin的得分接近14%。到了8月,智能體AI系統(tǒng)的得分接近40%,而今天,它們已經(jīng)突破了60%的里程碑。
與此同時(shí),去年12月,OpenAI的新O3模型(一個(gè)尚未向公眾公開的智能體模型)在同一測(cè)試上得了72%。根據(jù)Capgemini于2024年中發(fā)布的一項(xiàng)調(diào)查,60%的大型公司高管表示,智能體將在三到五年內(nèi)處理企業(yè)中的大部分編碼工作。
但已經(jīng)有一些特定于軟件開發(fā)生命周期的工作崗位準(zhǔn)備好借助智能體。
“我們開發(fā)了自己的自主式AI用于代碼管理,”Mitre的首席技術(shù)官Charles Clancy說(shuō),“似乎效果最好的最佳用例是在存儲(chǔ)庫(kù)管理中,在那里,它將遍歷并進(jìn)行代碼存儲(chǔ)庫(kù)的錯(cuò)誤修復(fù)?!?/p>
例如,他說(shuō),10年前的源代碼可能無(wú)法在現(xiàn)代計(jì)算機(jī)上正確編譯。
“智能體將下載它,嘗試構(gòu)建它,如果它無(wú)法運(yùn)行,它將在必要時(shí)修復(fù)構(gòu)建腳本和代碼,將代碼檢查回存儲(chǔ)庫(kù),并標(biāo)記它是由智能體完成的?!彼f(shuō)。
Clancy補(bǔ)充說(shuō),Mitre不得不創(chuàng)建自己的系統(tǒng),因?yàn)榇蠖鄶?shù)現(xiàn)有工具使用供應(yīng)商管理的云基礎(chǔ)設(shè)施進(jìn)行AI推理部分?!俺鲇诎踩颍覀儾荒苓@樣做。”他說(shuō)。
他還說(shuō),還有一個(gè)單獨(dú)的研究項(xiàng)目正在研究50年前的主機(jī)代碼,并使用AI提取業(yè)務(wù)邏輯,并為其重寫云原生框架。
“我們的目標(biāo)是在所有政府組織中現(xiàn)代化復(fù)雜且關(guān)鍵的任務(wù)舊版IT系統(tǒng)?!彼f(shuō)。
這些系統(tǒng)中有數(shù)百萬(wàn)行代碼,是用COBOL、MUMPS,甚至是與原始硬件綁定的匯編語(yǔ)言編寫的。“我們正在開發(fā)自己的AI模型,以定制改進(jìn)稀有平臺(tái)上的代碼理解。”他補(bǔ)充道。
Mitre還在一個(gè)安全的、由Mitre管理的云環(huán)境中使用AWS Bedrock測(cè)試了數(shù)十個(gè)商業(yè)AI模型。到目前為止,已經(jīng)處理了50多萬(wàn)行代碼,但由于幻覺(jué)和其他質(zhì)量問(wèn)題,仍然需要人工監(jiān)督。
“我們還發(fā)現(xiàn),自主式AI可以與為軟件工程師開發(fā)的工具一起工作,從而顯著提高驗(yàn)證和編譯代碼的成功率,”Clancy說(shuō)。這提供了潛在途徑來(lái)訓(xùn)練新的AI,以減少對(duì)監(jiān)督的需求?!凹词箍紤]到必要的人工監(jiān)督,這個(gè)過(guò)程也在每天都在加快。”
去年12月,Langbase發(fā)布了一份智能體狀態(tài)報(bào)告,基于來(lái)自高管和技術(shù)專業(yè)人士的3400多份回復(fù)。智能體的首要用例是軟件開發(fā),有87%的受訪者表示正在使用。此外,48%的人表示他們正在IT和運(yùn)營(yíng)中使用大型語(yǔ)言模型(LLM)。
2. 自動(dòng)化和生產(chǎn)率
由于智能體可以接觸許多系統(tǒng),工作流程自動(dòng)化和生產(chǎn)率成為企業(yè)的首要用例。根據(jù)KPMG的報(bào)告,行政職責(zé)是智能體的主要用例,有60%的受訪者表示正在使用。以全球律所Avantia為例,該律所使用商業(yè)和開源通用AI為其智能體提供支持?!拔覀冾I(lǐng)域的關(guān)鍵挑戰(zhàn)是,有數(shù)百項(xiàng)任務(wù)可能無(wú)法很好地自動(dòng)化,”首席技術(shù)官Paul Gaskell說(shuō),“而且它們不太適合SaaS解決方案。有太多的單獨(dú)任務(wù)分散在太多的地方?!?/p>
現(xiàn)在,有了微軟,智能體可以作為伴侶坐在Word或Outlook中,隨時(shí)準(zhǔn)備執(zhí)行任務(wù)。
“如果客戶要求我們執(zhí)行交易或工作流程,并且Outlook或Word是打開的,智能體可以訪問(wèn)所有公司數(shù)據(jù),”他說(shuō)?!岸?,因?yàn)檫@些是我們的律師正在處理的文檔,我們有他們通常做什么的歷史記錄。”
從業(yè)務(wù)角度來(lái)看,律師可以更快地完成合同簽訂流程、更快地回應(yīng)客戶、并以比其他人更快的速度進(jìn)行交易。
Gaskell預(yù)計(jì),到2025年中,利潤(rùn)率將提高多達(dá)45%?!拔覀円呀?jīng)對(duì)已經(jīng)完成的工作進(jìn)行了時(shí)間和動(dòng)作研究,”他說(shuō),“我很難想象這不會(huì)成為專業(yè)服務(wù)業(yè)的未來(lái)?!?/p>
Gaskell說(shuō),他的公司對(duì)LLM持不可知論態(tài)度,這意味著智能體可以根據(jù)哪個(gè)最適合,由不同的LLM提供支持。這包括一些主要的開源模型,他說(shuō),因?yàn)樗鼈兲峁┝穗[私、成本優(yōu)勢(shì)和更低的延遲。智能體目前運(yùn)行在超大規(guī)模云服務(wù)商的服務(wù)器上,但該公司正在考慮投資自己的GPU,并在托管設(shè)施中租用空間,以進(jìn)一步降低成本。
另一家使用智能體來(lái)自動(dòng)化業(yè)務(wù)流程的公司是SS&C,一家金融服務(wù)和醫(yī)療技術(shù)公司。
“我們從2萬(wàn)名客戶那里收到各種格式的文檔,”該公司自動(dòng)化高級(jí)常務(wù)董事Brian Halpin說(shuō)。這些可能是PDF、數(shù)字表格、電子郵件,關(guān)鍵信息可能位于任何位置,并以不同的方式呈現(xiàn)。這加起來(lái)每月需要處理數(shù)百萬(wàn)份文檔。“理解文檔的上下文是至關(guān)重要的,”他補(bǔ)充道,而過(guò)去,這一直是阻礙自動(dòng)化的最大障礙,而通用AI可以提供幫助。
“因此,今天,我們有20個(gè)圍繞文檔使用智能體的生產(chǎn)用例,”Halpin說(shuō),“這很有用,也很強(qiáng)大?!睌?shù)據(jù)保存在私有云中以確保安全,LLM也在內(nèi)部托管。SS&C使用Meta的Llama以及其他模型,Halpin說(shuō)。
該系統(tǒng)于2024年中投入生產(chǎn),并在去年11月處理了5萬(wàn)份文檔?!拔覀儗⒗^續(xù)增加這一數(shù)量?!彼f(shuō)。
他說(shuō),在傳統(tǒng)自動(dòng)化中,人類幾乎需要查看每份文檔。有了AI,這個(gè)比例被顛倒了。例如,在貸款文件類型中,自動(dòng)化的比例達(dá)到90%左右,只有少數(shù)文件需要人工審查。
3. 客戶服務(wù)和支持
在鄧白氏,智能體幫助客戶與該公司收集的關(guān)于世界上5000萬(wàn)家企業(yè)的信息互動(dòng)。
“我們?yōu)?5%的財(cái)富500強(qiáng)企業(yè)提供服務(wù),他們使用我們的數(shù)據(jù)來(lái)做出一些最重要的決策,”該公司的首席數(shù)據(jù)和分析官Gary Kotovets說(shuō)。這包括信貸決策和供應(yīng)鏈決策,他說(shuō)。數(shù)據(jù)還用于銷售和營(yíng)銷。
“對(duì)我們來(lái)說(shuō),智能體對(duì)于與我們的數(shù)據(jù)互動(dòng)至關(guān)重要,”他說(shuō)?!八鼈?cè)试S客戶提出與公司相關(guān)的問(wèn)題,智能體將確保數(shù)據(jù)是與該公司最相關(guān)的準(zhǔn)確信息?!边@并不總是那么容易,因?yàn)樵S多公司的名稱和地址相似。“這就是智能體發(fā)揮作用的地方。我們的智能體說(shuō),‘讓我確保這家公司是他們正在詢問(wèn)的實(shí)際公司?!鼈兡軌蚶斫馑岢龅膯?wèn)題?!?/p>
4. 內(nèi)容創(chuàng)作
撰寫文本和創(chuàng)建圖像是通用AI最早的兩個(gè)流行用例?,F(xiàn)在,智能體可以加速內(nèi)容創(chuàng)作過(guò)程。根據(jù)Langbase的調(diào)查,文本生成和摘要是第二受歡迎的用例,有59%的受訪者表示正在使用,其次是營(yíng)銷和傳播,有50%的受訪者表示正在使用。安永在其第三方風(fēng)險(xiǎn)管理服務(wù)中使用智能體。
安永的負(fù)責(zé)人辛克萊·舒勒表示:“你們聘請(qǐng)我們來(lái)評(píng)估你們引入的一些供應(yīng)商?!薄拔覀兊娘L(fēng)險(xiǎn)評(píng)估人員會(huì)完成這項(xiàng)工作,在一個(gè)供應(yīng)商身上花費(fèi)多達(dá) 50 個(gè)小時(shí),仔細(xì)研究合同和其他文件,以制作出一份報(bào)告,指出我們觀察到的風(fēng)險(xiǎn)?!?/p>
過(guò)去通常都是這樣做的,直到GenAI的出現(xiàn)。
“現(xiàn)在我們可以把所有合同和公開文件輸入給人工智能,它可以在幾分鐘內(nèi)就生成一份報(bào)告,而不是過(guò)去需要的幾天,并且報(bào)告內(nèi)容極為準(zhǔn)確詳細(xì)?!彼硎尽H缓笕祟悓<視?huì)對(duì)這些報(bào)告進(jìn)行完善。“人工智能加上人類專業(yè)知識(shí),在質(zhì)量上是一個(gè)巨大的提升?!彼f(shuō)。
現(xiàn)在,隨著自主式AI的出現(xiàn),這個(gè)過(guò)程又在發(fā)生變化。
“我們將發(fā)布這個(gè)過(guò)程的智能體驅(qū)動(dòng)版本,實(shí)現(xiàn)對(duì)供應(yīng)商的持續(xù)監(jiān)控,這在以前是不可能的。”他說(shuō)。
這是公司在考慮 AI 智能體時(shí)經(jīng)常忽視的一點(diǎn),他表示?!昂芏嗳税殃P(guān)注點(diǎn)放在了優(yōu)化用例上,”他說(shuō)?!暗嬲膬r(jià)值在于市場(chǎng)的拓展,以及收入機(jī)會(huì)的增加。”
5. 人力資源和員工支持
智能體的另一個(gè)相對(duì)低風(fēng)險(xiǎn)、高價(jià)值的應(yīng)用場(chǎng)景是回答員工問(wèn)題,并代為處理簡(jiǎn)單任務(wù)。事實(shí)上,IBM 在 2024 年 1 月進(jìn)行的一項(xiàng)關(guān)于通用人工智能發(fā)展的調(diào)查中得出結(jié)論,43% 的公司使用 AI 智能體來(lái)進(jìn)行人力資源管理。
例如,全球數(shù)據(jù)服務(wù)公司 Indicium 從 2024 年年中開始部署智能體,當(dāng)時(shí)這項(xiàng)技術(shù)開始成熟。
“你會(huì)開始看到現(xiàn)成的應(yīng)用程序——既有開源的,也有專有的——這讓構(gòu)建智能體變得更加容易?!痹摴镜氖紫瘮?shù)據(jù)官丹尼爾·阿萬(wàn)奇尼表示。
他表示,這些智能體被用來(lái)讓 HR 的工作更加輕松,包括內(nèi)部知識(shí)檢索、標(biāo)記、記錄以及其他業(yè)務(wù)流程。每個(gè)智能體就像一個(gè)微服務(wù),專門負(fù)責(zé)一件事情。“它們?cè)谝粋€(gè)多智能體系統(tǒng)中相互通信,”他說(shuō)。這些基于提示的對(duì)話可能會(huì)變得很奇怪。棘手的是,通用人工智能可能會(huì)產(chǎn)生幻覺(jué)等問(wèn)題?!耙虼?,我們需要對(duì)模型進(jìn)行大量調(diào)整,以防止它們做出錯(cuò)誤行為或訪問(wèn)錯(cuò)誤信息?!彼f(shuō)。
從積極的一面來(lái)看,AI 智能體可以自主處理很多問(wèn)題,因此在這方面具有商業(yè)價(jià)值?!拔覀冞€發(fā)現(xiàn)了未正確記錄的內(nèi)容,這有助于我們改進(jìn)流程。”他補(bǔ)充道。
信任但要驗(yàn)證
安全性是智能體開發(fā)自始至終的基石。事實(shí)上,最早的智能體框架之一是 BabyAGI,于 2023 年年初發(fā)布,它將 ChatGPT 與 Pinecone 向量數(shù)據(jù)庫(kù)(用于記憶)和 LangChain(用于編排)相結(jié)合。創(chuàng)建它的開發(fā)者開玩笑地要求它制造盡可能多的回形針——這是對(duì)一種假設(shè)的由失控 AI 引發(fā)的回形針末日的引用——該系統(tǒng)立即認(rèn)識(shí)到了潛在問(wèn)題,并首先為自己生成了一個(gè)安全協(xié)議,但大多數(shù)智能體型 AI 開發(fā)者并不愿意對(duì) AI 如此信任。
在 LangChain 2023 年 11 月對(duì) 1300 多名專業(yè)人士進(jìn)行的調(diào)查中,55% 的受訪者表示,追蹤和可觀察性工具是智能體不可或缺的控件,有助于他們了解智能體的行為和性能。此外,44% 的受訪者設(shè)置了防護(hù)欄,40% 使用了離線評(píng)估。
“AI 模型存在風(fēng)險(xiǎn),會(huì)犯各種各樣的錯(cuò)誤,”瑞典烏默奧大學(xué)計(jì)算機(jī)科學(xué)系和技術(shù)政策理事會(huì)主席弗吉尼亞·迪格努姆表示。
但她表示,可以創(chuàng)建系統(tǒng)來(lái)捕捉錯(cuò)誤,因此,如果智能體無(wú)法完成任務(wù),它會(huì)承認(rèn)失敗,而不是嘗試編造內(nèi)容。
“這一領(lǐng)域有很多研究,并且理論上已經(jīng)有了成果,”她說(shuō)。“但據(jù)我所知,目前還沒(méi)有合適的智能體界面,而且,一旦開始開發(fā)這些系統(tǒng),就必須應(yīng)對(duì)由此產(chǎn)生的后果,以及如果其中一個(gè)系統(tǒng)出錯(cuò)會(huì)發(fā)生什么?!?/p>
這意味著需要制定治理和監(jiān)管措施。智能體框架不僅需要處理 AI 可能犯錯(cuò)的實(shí)際和業(yè)務(wù)影響,還需要處理法律影響。
“如果這些問(wèn)題得不到解決,我認(rèn)為企業(yè)智能體就不會(huì)有多大用處?!彼f(shuō)。
然后,企業(yè)在部署 AI 智能體時(shí)還需要應(yīng)對(duì)另一個(gè)風(fēng)險(xiǎn):智能體實(shí)現(xiàn)的 AI 驅(qū)動(dòng)自動(dòng)化的大規(guī)模可能帶來(lái)的顛覆和負(fù)面結(jié)果。Wipro 的副總裁兼全球 AI 主管普什帕·拉馬錢德蘭表示,在部署這些系統(tǒng)時(shí),變革管理過(guò)程非常重要。“這是我認(rèn)為很多客戶需要花費(fèi)更多時(shí)間的地方,”他說(shuō)。而前期多花些時(shí)間意味著公司從長(zhǎng)遠(yuǎn)來(lái)看能走得更遠(yuǎn)。“那些認(rèn)真考慮變革管理過(guò)程的公司能夠更快地實(shí)現(xiàn)規(guī)模擴(kuò)張。”他說(shuō)。