企業(yè)成功部署智能體的關(guān)鍵要素

毫無(wú)疑問(wèn),智能體——那些能夠在企業(yè)工作流中自主、異步運(yùn)作的系統(tǒng)——目前正是企業(yè)界的熱門(mén)話(huà)題。
然而,越來(lái)越多的人擔(dān)心,這些討論大多停留在口頭上,充滿(mǎn)炒作,卻缺乏實(shí)質(zhì)性支撐。
例如,Gartner指出,企業(yè)正處于“期望膨脹的頂峰”,這是在失望感出現(xiàn)之前的一段時(shí)期,因?yàn)楣?yīng)商尚未用真實(shí)的、可落地的案例支撐其承諾。
當(dāng)然,這并不意味著企業(yè)沒(méi)有在嘗試智能體并獲得早期投資回報(bào),全球企業(yè)如Block和GlaxoSmithKline(GSK)正分別在金融服務(wù)和藥物研發(fā)中探索概念驗(yàn)證。
Block負(fù)責(zé)AI和數(shù)據(jù)平臺(tái)的技術(shù)主管Brad Axen在本月由SAP贊助的AI Impact活動(dòng)上對(duì)VentureBeat CEO兼主編Matt Marshall表示:“多智能體絕對(duì)是未來(lái)趨勢(shì),但我們正在探索一種既符合人類(lèi)使用習(xí)慣又方便的實(shí)現(xiàn)方式。”
與單一同事合作,而非一群機(jī)器人
Block是Square、Cash App和Afterpay的母公司,擁有1萬(wàn)名員工,公司目前處于全面探索階段。今年1月,Block推出了一個(gè)可互操作的智能體框架,代號(hào)“Goose”。
Axen解釋稱(chēng),Goose最初用于軟件工程任務(wù),目前已被4000名工程師使用,且采用率每月翻倍,該平臺(tái)可以生成約90%的代碼,通過(guò)自動(dòng)化代碼生成、調(diào)試和信息篩選,每周為工程師節(jié)省約10小時(shí)工作量。
除了編寫(xiě)代碼,Goose還充當(dāng)“數(shù)字隊(duì)友”,壓縮Slack和電子郵件信息流,整合公司工具,并在任務(wù)需要更高吞吐量或更大范圍時(shí)生成新智能體。
Axen強(qiáng)調(diào),Block致力于打造一個(gè)界面,讓用戶(hù)感受像在與單一同事協(xié)作,而不是與一群機(jī)器人互動(dòng)?!拔覀兿M脩?hù)感受到自己只在與一個(gè)人合作,但這個(gè)人會(huì)在多個(gè)場(chǎng)景和方式中代表你行動(dòng)?!?/p>
Goose在開(kāi)發(fā)環(huán)境中實(shí)時(shí)運(yùn)行,根據(jù)大語(yǔ)言模型(LLM)輸出進(jìn)行搜索、導(dǎo)航和代碼編寫(xiě),同時(shí)還能自主讀取和寫(xiě)入文件、運(yùn)行代碼和測(cè)試、優(yōu)化輸出以及安裝依賴(lài)。
基本上,任何人都可以在自己偏好的LLM上構(gòu)建和操作系統(tǒng),而Goose可被視為應(yīng)用層,它內(nèi)置桌面應(yīng)用和命令行界面,開(kāi)發(fā)者也可以構(gòu)建自定義UI,該平臺(tái)基于Anthropic的Model Context Protocol(MCP)構(gòu)建,這是一套日益流行的開(kāi)源標(biāo)準(zhǔn)化API和端點(diǎn),用于將智能體連接到數(shù)據(jù)存儲(chǔ)、工具和開(kāi)發(fā)環(huán)境。
Goose已以開(kāi)源Apache License 2.0(ASL2)發(fā)布,意味著任何人都可以免費(fèi)使用、修改和分發(fā),包括商業(yè)用途。用戶(hù)可以訪問(wèn)Databricks數(shù)據(jù)庫(kù)并執(zhí)行SQL查詢(xún),無(wú)需技術(shù)背景。
Axen解釋道:“我們希望建立一個(gè)流程,讓用戶(hù)無(wú)需成為專(zhuān)家也能從系統(tǒng)中獲取價(jià)值。”
例如,在編程中,用戶(hù)可以用自然語(yǔ)言描述需求,框架將其轉(zhuǎn)化為數(shù)千行代碼供開(kāi)發(fā)者閱讀和篩選。Block在信息壓縮任務(wù)中也看到了價(jià)值,例如Goose可以讀取Slack、郵件及其他渠道信息,并為用戶(hù)總結(jié)要點(diǎn)。在銷(xiāo)售或營(yíng)銷(xiāo)中,智能體還能收集潛在客戶(hù)相關(guān)信息并導(dǎo)入數(shù)據(jù)庫(kù)。
智能體未充分利用,仍需人類(lèi)專(zhuān)業(yè)知識(shí)
Axen指出,流程是最大瓶頸。你不能僅僅給員工一款工具就期望其自動(dòng)發(fā)揮作用,智能體必須反映員工已在使用的流程。人類(lèi)關(guān)注的不是技術(shù)架構(gòu),而是他們要完成的工作。
因此,構(gòu)建者需要了解員工的實(shí)際需求,并設(shè)計(jì)出“盡可能貼合這些需求”的工具。隨后可以將這些工具串聯(lián)起來(lái),解決越來(lái)越復(fù)雜的問(wèn)題。
Axen說(shuō):“我認(rèn)為我們遠(yuǎn)未充分利用智能體的能力。關(guān)鍵在于人和流程,因?yàn)槲覀儫o(wú)法完全跟上技術(shù)的發(fā)展。技術(shù)與機(jī)會(huì)之間存在巨大差距。”
當(dāng)行業(yè)縮小這一差距時(shí),人類(lèi)專(zhuān)業(yè)知識(shí)是否還有空間?Axen表示,當(dāng)然有。例如,在金融服務(wù)中,代碼必須可靠、合規(guī)且安全,以保護(hù)公司和用戶(hù),因此仍需人眼審核。
他說(shuō):“在公司運(yùn)營(yíng)的每個(gè)環(huán)節(jié),我們依然需要人類(lèi)專(zhuān)家。它不改變個(gè)體的專(zhuān)業(yè)意義,只是提供了一種新的表達(dá)工具?!?/p>
Block構(gòu)建在開(kāi)源基礎(chǔ)上
Axen指出,人機(jī)界面是智能體最難實(shí)現(xiàn)的部分,目標(biāo)是讓界面簡(jiǎn)單易用,同時(shí)AI在后臺(tái)主動(dòng)執(zhí)行任務(wù)。
他認(rèn)為,如果更多行業(yè)玩家采用類(lèi)似MCP的標(biāo)準(zhǔn),將會(huì)更有幫助。例如:“我希望Google能為Gmail提供公開(kāi)的MCP,這會(huì)大大簡(jiǎn)化我的工作?!?/p>
談及Block對(duì)開(kāi)源的承諾,他表示:“我們的基礎(chǔ)一直是開(kāi)源的?!辈⒀a(bǔ)充稱(chēng),過(guò)去一年公司一直在“更新”對(duì)開(kāi)源技術(shù)的投資?!霸诳焖侔l(fā)展的領(lǐng)域,我們希望建立開(kāi)源治理,使工具能夠跟上新模型和新產(chǎn)品的步伐?!?/p>
GSK在藥物研發(fā)中應(yīng)用多智能體的經(jīng)驗(yàn)
GSK是一家領(lǐng)先的制藥企業(yè),專(zhuān)注疫苗、傳染病及腫瘤研究。公司開(kāi)始應(yīng)用多智能體架構(gòu),加速藥物研發(fā)。
GSK的AI和機(jī)器學(xué)習(xí)全球負(fù)責(zé)人、SVP Kim Branson表示,智能體正在改變公司的產(chǎn)品開(kāi)發(fā),“絕對(duì)是業(yè)務(wù)核心”。
Branson解釋稱(chēng),GSK科學(xué)家將領(lǐng)域特定LLM與本體(表示概念及其屬性和關(guān)系的類(lèi)別)、工具鏈及嚴(yán)格測(cè)試框架結(jié)合使用。
這幫助他們查詢(xún)龐大的科學(xué)數(shù)據(jù)集、規(guī)劃實(shí)驗(yàn)(即使沒(méi)有基準(zhǔn)數(shù)據(jù)),并整合基因組學(xué)、蛋白質(zhì)組學(xué)和臨床數(shù)據(jù)的證據(jù)。智能體可以提出假設(shè)、驗(yàn)證數(shù)據(jù)關(guān)聯(lián)并壓縮研究周期。
Branson指出,科學(xué)發(fā)現(xiàn)已取得重大進(jìn)展:測(cè)序時(shí)間縮短,蛋白質(zhì)組學(xué)研究加快,但隨著數(shù)據(jù)量不斷增加(尤其是通過(guò)設(shè)備和可穿戴設(shè)備收集),發(fā)現(xiàn)過(guò)程變得愈發(fā)復(fù)雜。他表示:“我們對(duì)人體的連續(xù)脈搏數(shù)據(jù)比人類(lèi)歷史上任何時(shí)候都多?!?/p>
人類(lèi)幾乎無(wú)法分析全部數(shù)據(jù),因此GSK希望利用AI加速迭代。
然而,在制藥行業(yè),AI使用也充滿(mǎn)挑戰(zhàn),因?yàn)樵跊](méi)有大型臨床實(shí)驗(yàn)的情況下往往不存在“基準(zhǔn)真相”,更多是基于假設(shè),科學(xué)家通過(guò)探索證據(jù)提出可能的解決方案。
Branson指出:“當(dāng)引入智能體時(shí),你會(huì)發(fā)現(xiàn)大多數(shù)人內(nèi)部甚至沒(méi)有標(biāo)準(zhǔn)方法,這種差異并非壞事,但有時(shí)會(huì)引發(fā)新的問(wèn)題?!?/p>
他打趣道:“我們不總是有絕對(duì)真相可依,否則我的工作會(huì)容易很多?!?/p>
關(guān)鍵在于找到正確的目標(biāo)或設(shè)計(jì)潛在生物標(biāo)志物/假設(shè)證據(jù)。例如:在特定條件下,哪條途徑最適合卵巢癌患者?
要讓AI理解這種推理,需要使用本體并提出諸如‘如果這是真的,X意味著什么?’的問(wèn)題。領(lǐng)域特定智能體可以從大型內(nèi)部數(shù)據(jù)集中整合相關(guān)證據(jù)。
Branson解釋?zhuān)珿SK從零構(gòu)建了基于Cerebras的表觀基因組語(yǔ)言模型,用于推理和訓(xùn)練?!拔覀?yōu)閼?yīng)用構(gòu)建非常特定的模型,是其他公司沒(méi)有的?!?/p>
推理速度非常重要,無(wú)論是與模型的交互還是自主深度研究,GSK根據(jù)最終目標(biāo)使用不同工具,但大上下文窗口并非萬(wàn)能,數(shù)據(jù)過(guò)濾至關(guān)重要?!安荒茈S意堆疊上下文,不能把所有數(shù)據(jù)丟進(jìn)去就指望LLM自己搞定?!?/p>
持續(xù)測(cè)試至關(guān)重要
GSK在智能體系統(tǒng)中投入大量測(cè)試,優(yōu)先考慮確定性和可靠性,常同時(shí)運(yùn)行多個(gè)智能體交叉驗(yàn)證結(jié)果。
Branson回憶,團(tuán)隊(duì)初期構(gòu)建SQL智能體時(shí),運(yùn)行“1萬(wàn)次”,卻莫名其妙地出現(xiàn)一次數(shù)據(jù)“造假”。
“我們?cè)僖矝](méi)遇到過(guò),但那一次發(fā)生時(shí),我們甚至不明白為什么會(huì)在該LLM上出現(xiàn)?!?/p>
因此,團(tuán)隊(duì)通常會(huì)并行運(yùn)行多個(gè)副本和模型,同時(shí)強(qiáng)制執(zhí)行工具調(diào)用和約束。例如,兩套LLM執(zhí)行完全相同的序列,GSK科學(xué)家進(jìn)行交叉驗(yàn)證。
團(tuán)隊(duì)專(zhuān)注于主動(dòng)學(xué)習(xí)循環(huán),并建立內(nèi)部基準(zhǔn),因?yàn)楣_(kāi)基準(zhǔn)往往“相當(dāng)學(xué)術(shù)化,不反映我們的實(shí)際工作”。
例如,他們會(huì)生成多個(gè)生物學(xué)問(wèn)題,評(píng)分預(yù)期的黃金標(biāo)準(zhǔn),然后用LLM進(jìn)行驗(yàn)證并排名。
Branson說(shuō):“我們特別關(guān)注智能體出錯(cuò)或出現(xiàn)愚蠢行為的情況,因?yàn)槟钦菍W(xué)習(xí)新知識(shí)的機(jī)會(huì),我們會(huì)讓人類(lèi)在關(guān)鍵環(huán)節(jié)使用專(zhuān)業(yè)判斷?!?/p>






























