AI殺手級(jí)應(yīng)用有苗頭了,自主使用操作系統(tǒng)Agent智能體,開源!
最近微軟開源了一個(gè) Agent 叫 UFO,通過自然語言指令實(shí)現(xiàn) Windows 操作系統(tǒng)上的自動(dòng)化任務(wù)操作。
圖片
之前我們分享的 Agent 大多是自主使用瀏覽器,而 UFO 更進(jìn)了一步,可以使用操作系統(tǒng)中的各種APP幫你完成任務(wù)。
下面是 UFO 的架構(gòu)圖:
UFO2 architecture
可以看到,它是一個(gè)多Agent系統(tǒng),中間的 HostAgent 用來解析用戶的自然語言,啟動(dòng)必要的應(yīng)用程序。
下面的每個(gè)應(yīng)用程序都對(duì)應(yīng)一個(gè)Agent。
這讓我想到了前段時(shí)間谷歌提出的一個(gè)跟MCP類似協(xié)議——A2A,用于制定Agent之間通信的標(biāo)準(zhǔn)協(xié)議。
圖片
從 UFO 的架構(gòu)上看,普通A2A這類協(xié)議還是很有必要的。
假如上述應(yīng)用程序Agent都支持了A2A協(xié)議,那我們開發(fā)的Agent也就都能輕松調(diào)用Windows 系統(tǒng)的各種應(yīng)用程序,既能加快Agent開發(fā)效率,也可以大大提高Agent的能力。
最近,我們也在開發(fā)一個(gè)跟 Manus 類似的智能體,對(duì)AI時(shí)代“殺手級(jí)”應(yīng)用有一些思考。
我覺得“殺手級(jí)”應(yīng)用一定要具備的一個(gè)特點(diǎn)就是之前完全沒出現(xiàn)過,一定是一個(gè)全新物種。
比如,互聯(lián)網(wǎng)時(shí)代,淘寶就是一個(gè)殺手級(jí)應(yīng)用,是互聯(lián)網(wǎng)時(shí)代的全新物種。淘寶出現(xiàn)之前,不能甚至不敢想象,我們還可以完成跨時(shí)空購物。
反之,目前一些垂類Agent,比如旅游Agent,幫用戶自動(dòng)規(guī)劃出行、游玩。
這類Agent雖然能解決一大部分人的旅游需求,但它成不了“殺手級(jí)”,因?yàn)榧幢銢]有大模型,這類需求也能被滿足很好(旅行社),大模型無非解決的就是效率問題。
所以,從這個(gè)角度說,我覺得到目前為止,Manus、UFO這類智能體至少已經(jīng)有“殺手級(jí)”的苗頭。
雖然,這些產(chǎn)品現(xiàn)階段不可避免被大家吐槽智障,但起碼是一個(gè)全新物種。一句話讓一個(gè)Agent像助理一樣自動(dòng)幫你干完活,這個(gè)現(xiàn)象在之前是完全沒有的。
無論如何,AI時(shí)代,我們普通人最大的機(jī)會(huì)在于擁抱AI,積極擁抱變化,在AI浪潮中找到屬于自己的位置。