能耗比達(dá)到GPT-4 10倍!黃學(xué)東親自解密Zoom AI的成功之道,AI伴侶直接替你開(kāi)會(huì)
近日,AI大佬,現(xiàn)任Zoom CTO的黃學(xué)東,在自家的官網(wǎng)上發(fā)表了一篇博客。
其中隆重介紹了自己加入Zoom六個(gè)月之后創(chuàng)新的成果——Zoom AI Companion,以及驅(qū)動(dòng)Zoom AI Companion的Zoom聯(lián)邦(federated approach)AI。
在Zoom之前,黃學(xué)東曾擔(dān)任微軟Azure AI首席技術(shù)官,他不僅是微軟首位全球華人技術(shù)院士,也是微軟最高級(jí)別的華人科學(xué)家。
黃學(xué)東在微軟任職了超過(guò)30年,在他的牽線搭橋下,微軟于1998年在北京建起第一個(gè)亞洲研究院。
在2017年和2020年,黃學(xué)東分別當(dāng)選ACM和IEEE會(huì)士,并于2023年同時(shí)當(dāng)選美國(guó)國(guó)家工程院院士和美國(guó)藝術(shù)與科學(xué)院院士。
黃學(xué)東表示,人工智能從概念化到實(shí)現(xiàn)的轉(zhuǎn)型之旅,就像一條曲折的道路,充滿了不斷的破壞、適應(yīng)和創(chuàng)新。
「在過(guò)去的 30 年里,我一直走在這條道路上,從語(yǔ)音識(shí)別、自然語(yǔ)言理解,到計(jì)算機(jī)視覺(jué)。在我加入 Zoom 的過(guò)去六個(gè)月里,創(chuàng)新的步伐尤其令人震驚?!?/span>
Zoom聯(lián)邦A(yù)I,用合適的AI跑合適的任務(wù)
Zoom希望使用AI來(lái)改善人類協(xié)作方式,不斷提高生產(chǎn)力。
多年來(lái),Zoom一直在為客戶提供語(yǔ)音識(shí)別、計(jì)算機(jī)視覺(jué)、機(jī)器翻譯和大型語(yǔ)言模型(LLM)等AI服務(wù),以增強(qiáng)自家軟件的競(jìng)爭(zhēng)力。
他們的最新產(chǎn)品Zoom AI Companion,旨在幫助用戶提高工作效率、促進(jìn)無(wú)縫協(xié)作并獲得更深入的交流和見(jiàn)解。
Zoom的聯(lián)邦A(yù)I,能夠使用戶在之前付費(fèi)服務(wù)的基礎(chǔ)上,不用額外花錢就能享受AI Companion的功能。
這樣能夠大大提升用戶的體驗(yàn),還能快速提高新技術(shù)的在用戶中的參與率。
但是對(duì)于Zoom這樣擁有大量用戶,高強(qiáng)度使用AI功能的軟件,LLM推理的額外成本怎么負(fù)擔(dān)呢?
要知道,GitHub的Copilot被傳說(shuō),每月收費(fèi)10刀,依然每個(gè)用戶每月還要補(bǔ)貼20刀。
Zoom目前使用的LLM包括自有模型和第三方的模型(如OpenAI GPT-3.5和GPT-4,以及Anthropic Claude 2)。
Zoom聯(lián)邦A(yù)I,可以整合來(lái)自合作伙伴的最新的LLM技術(shù)(例如OpenAI最新發(fā)布的GPT-4 Turbo),進(jìn)一步改善Zoom客戶的端到端體驗(yàn)。
Zoom采用了具有更好成本效益的策略:
首先使用合適的低成本LLM來(lái)完成任務(wù),然后通過(guò)Z-Scorer評(píng)估初始任務(wù)完成質(zhì)量。
在有需要的情況下,Zoom會(huì)使用更高級(jí)的LLM, 對(duì)初始LLM所獲得的成果進(jìn)行改進(jìn)。
——這類似于一個(gè)有凝聚力的團(tuán)隊(duì)協(xié)同工作,能夠比一個(gè)人更高效地生產(chǎn)更高質(zhì)量的產(chǎn)品。
根據(jù)Zoom的內(nèi)部測(cè)試,與OpenAI GPT-3.5 Turbo或其他幾種最先進(jìn)的LLM相比,Zoom采用聯(lián)邦A(yù)I提高了AI Companion的輸出質(zhì)量,還有效地控制了成本。
黃學(xué)東表示,他們衡量性能的標(biāo)準(zhǔn)是更低的成本、更快的響應(yīng)時(shí)間和更高質(zhì)量的輸出。
上圖是Zoom AI Companion與GPT-4在英文會(huì)議查詢?nèi)蝿?wù)上的性能和成本對(duì)比。
圖中比較的兩個(gè)關(guān)鍵指標(biāo)為成本和輸出質(zhì)量。
Zoom AI Companion只用了不到GPT-4 6%的成本,就能達(dá)到幾乎相當(dāng)?shù)妮敵鲑|(zhì)量。
與微軟Copilot使用的GPT-4-32k模型相比,Zoom AI Companion的會(huì)議提問(wèn)功能,可降低成本,加快響應(yīng)速度,同時(shí)保持相當(dāng)?shù)妮敵鲑|(zhì)量。
上圖是Zoom AI Companion與GPT-4在多語(yǔ)言會(huì)議摘要任務(wù)上的對(duì)比。
此外,AI Companion的多語(yǔ)言性能,進(jìn)一步證明了Zoom聯(lián)邦A(yù)I的強(qiáng)大功能,支持除英語(yǔ)之外的32種語(yǔ)言。
由于大多數(shù)LLM主要是使用英語(yǔ)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,所以Zoom增加了翻譯模型來(lái)擴(kuò)展多語(yǔ)言能力。
上圖對(duì)比了Zoom AI Companion與Microsoft Copilot在多語(yǔ)言會(huì)議摘要任務(wù)中的表現(xiàn),同樣使用GPT-4作為Microsoft Copilot的代理來(lái)進(jìn)行對(duì)比。
在Zoom AI Companion的多語(yǔ)言會(huì)議摘要中,使用Zoom的翻譯模型將非英語(yǔ)文本翻譯成英語(yǔ),這樣能同時(shí)考慮翻譯數(shù)據(jù)與原始數(shù)據(jù)。
從圖中可以看出,Zoom AI Companion以不到6%的成本完成了質(zhì)量接近于GPT-4-32k的輸出(97%)。
Zoom相信,人工智能的好處應(yīng)該讓盡可能多的人廣泛使用,而Zoom的聯(lián)邦A(yù)I能夠無(wú)縫結(jié)合不同AI系統(tǒng)的優(yōu)勢(shì),提供高性能結(jié)果,在實(shí)現(xiàn)這一愿景方面發(fā)揮著重要作用。
Zoom AI Companion,最智能的會(huì)議助手
而Zoom現(xiàn)在幾乎所有AI功能的入口,都集中在了他們9月底推出的Zoom AI Companion上。
作為Zoom提供的「充值服務(wù)」,它利用Zoom提供的AI能力,能幫助你在中途加入會(huì)議之后,自動(dòng)總結(jié)錯(cuò)過(guò)的會(huì)議內(nèi)容。
然后輪到你發(fā)言時(shí),結(jié)合你的觀點(diǎn)和之前會(huì)議的內(nèi)容,生成發(fā)言稿,真的做到了「替代用戶開(kāi)會(huì)」。
在半程加入會(huì)議之后,AI可以告訴你會(huì)議的重點(diǎn)。
還能幫你實(shí)時(shí)轉(zhuǎn)錄翻譯其他參會(huì)者發(fā)言,一鍵獲取會(huì)議討論文本。
AI還能幫你把碎片化的信息歸納出來(lái),最后為團(tuán)隊(duì)生成會(huì)議總結(jié)和記錄。
還能把Zoom平臺(tái)上獲得的客戶短信息進(jìn)行總結(jié),生成具體的執(zhí)行方案。
而且對(duì)于參加不了的會(huì)議,還可以在日程表上直接安排AI智能錄制,之后分段分重點(diǎn)回看。
而這整個(gè)AI伴侶背后,都凝結(jié)了Zoom和黃學(xué)東聯(lián)邦A(yù)I的技術(shù)思路,用合適的AI資源去處理合適的請(qǐng)求。
而且Zoom承諾,不會(huì)使用用戶的任何音頻、視頻、聊天、屏幕共享、附件或客戶生成的內(nèi)容(例如投票結(jié)果、白板)等其他數(shù)據(jù)來(lái)訓(xùn)練Zoom或第三方的AI。
這么多好用的功能,這么負(fù)責(zé)的AI,需要花多少錢呢?
150刀到200刀就能用一年,企業(yè)用戶還有專門的定制版本。