清華特獎(jiǎng)焦劍濤大模型創(chuàng)業(yè):突破GPT-4工具使用能力,搞開源種子輪融資七千萬
兩位清華校友打造,在GPT-4核心優(yōu)勢(shì)之一使用工具上實(shí)現(xiàn)超越。
連HuggingFace CEO都來幫它造勢(shì):

它的名字叫“NexusRaven”,參數(shù)只有130億。
出色的函數(shù)調(diào)用能力連網(wǎng)友都忍不住稱贊,既可以并行也可以嵌套。

背后團(tuán)隊(duì)則更令人矚目:
一共三位創(chuàng)始人,除了兩位清華校友(其中一位拿過清華特獎(jiǎng)),還有一位在工業(yè)界干了15年的AI大牛。

他們創(chuàng)辦的公司(也就是該模型所屬的公司),在種子輪就已經(jīng)融資1060萬美元(約合人民幣7600萬)。
如此大有來頭的模型和團(tuán)隊(duì),我們?nèi)滩蛔“橇税恰?/p>
清華特獎(jiǎng)得主聯(lián)合創(chuàng)辦
這家公司名叫Nexusflow,今年9月剛剛亮相,并當(dāng)即宣布千萬美元級(jí)種子輪融資。
它在短短不到3個(gè)月的時(shí)間就發(fā)布了2代大模型NexusRaven,其中第二代直接單點(diǎn)突破GPT-4,引起開源社區(qū)大量關(guān)注。
NexusRaven的開源和商用,是完全不用擔(dān)心侵權(quán)的那種,因?yàn)樗挠?xùn)練不涉及任何由專有LLM(如GPT-4) 生成的數(shù)據(jù)。
當(dāng)然,隱私數(shù)據(jù)就更不用擔(dān)心了,NexusRaven稱自己的安全性比GPT-4要高了21個(gè)百分點(diǎn)。

三位創(chuàng)始人中,CEO為焦劍濤。
他本科畢業(yè)于清華大學(xué)電子工程系,2018年從斯坦福博士畢業(yè),進(jìn)入加州大學(xué)伯克利分校擔(dān)任助理教授。

在伯克利,作為BAIR的一員,焦劍濤與Michael Jordan、姚班校友朱晨光等均有合作。

值得一提的是,焦劍濤是2011年清華特獎(jiǎng)得主,還與有“清華學(xué)神”之稱的學(xué)弟韓衍雋有過一段“傳承”故事:
韓衍雋曾表示,自己在美國交流期間,受到過焦劍濤很大的影響。
Nexusflow并非焦劍濤的第一次創(chuàng)業(yè)。在他攻讀博士期間,就曾與另一位清華電子系校友張文鑄聯(lián)合創(chuàng)立了“AI+教育”的清帆科技。
CTO Jian Zhang,同樣是清華電子系校友,2020年畢業(yè)于斯坦福大學(xué)計(jì)算機(jī)科學(xué)專業(yè)。
加入Nexusflow創(chuàng)業(yè)團(tuán)隊(duì)之前,Jian Zhang曾任SambaNova Systems機(jī)器學(xué)習(xí)總監(jiān),該公司是一家人工智能芯片初創(chuàng)公司,估值超50億美元。

最后一位創(chuàng)始人Kurt Keutzert是加州大學(xué)伯克利分校教授,h指數(shù)為100,論文總引用量超5萬,研究重點(diǎn)包括用并行和分布式計(jì)算加速深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練、計(jì)算機(jī)視覺等AI方向。
他曾是貝爾實(shí)驗(yàn)室的一員,后于1991-1998年任EDA公司新思科技CTO和高級(jí)副總裁。1997年,他拿到了加州大學(xué)伯克利分校的教職,進(jìn)入學(xué)術(shù)界工作。
有意思的是,Keutzert事實(shí)上并未離開工業(yè)界——他一直以來還兼任著天使投資人和顧問的角色。
而他和博士生Forrest Iandola共同創(chuàng)立的DeepScale——一家研究自動(dòng)駕駛汽車感知系統(tǒng)技術(shù)的公司,還在2019年被特斯拉收購了。

三位背景過硬的大佬,創(chuàng)辦的公司Nexusflow所瞄準(zhǔn)的方向,則是大模型在網(wǎng)絡(luò)安全中的應(yīng)用。

用官方的話說,是要“利用生成式AI徹底改變網(wǎng)絡(luò)安全”,包括:
用統(tǒng)一對(duì)話界面簡化軟件配置、集成和使用,提供解決方案簡化網(wǎng)絡(luò)安全運(yùn)營中檢測(cè)、調(diào)查、響應(yīng)和修復(fù)的各個(gè)環(huán)節(jié),以及在大模型時(shí)代保護(hù)用戶不受提示注入、數(shù)據(jù)泄露等新的安全問題的影響等等。
簡而言之,就是在流程上解放網(wǎng)絡(luò)安全從業(yè)人員。
公開兩個(gè)月,即發(fā)布NexusRaven-V2,也正是焦劍濤、Kurt Keutzer和Jian Zhang這三位創(chuàng)始人目標(biāo)的初步體現(xiàn):
用一個(gè)更經(jīng)濟(jì)高效的模型,實(shí)現(xiàn)更強(qiáng)大的“工具”調(diào)用能力。

那么,它旗下的“明星出品”:NexusRaven-V2,究竟什么樣?
模型更小,函數(shù)調(diào)用能力更強(qiáng)
據(jù)介紹,NexusRaven-V2完全基于開放數(shù)據(jù)集打造,并在CodeLlama-13B-instruct上進(jìn)行了指令微調(diào)。
它的主要功能就是將人類給出的自然語言指令轉(zhuǎn)換為可執(zhí)行代碼,然后利用代碼來自動(dòng)使用工具完成任務(wù)。
聽起來和之前很火的AutoGPT很類似。
從官方給出的demo來看,它可以進(jìn)行最簡單的“附近美食”查找:
只需問它“Get me good food nearby?”,它就能立刻編寫出幾行代碼,然后開始定位你的城市、將城市坐標(biāo)轉(zhuǎn)換為經(jīng)緯度、領(lǐng)取目標(biāo)任務(wù)(20個(gè)飯店建議)以及按距離從遠(yuǎn)到近排序。

最終給出每一個(gè)飯店的谷歌地圖,還能點(diǎn)擊進(jìn)行查看詳細(xì)評(píng)分等信息。

以及最最后還有一個(gè)文字版的總結(jié)。

稍微復(fù)雜一些的任務(wù)也行,比如找出舊金山市政廳20英里以內(nèi)、每晚價(jià)格200美元以上的酒店。
同樣的流程:代碼、執(zhí)行任務(wù)、出結(jié)果,包含地圖和最終列表總結(jié)。

當(dāng)然,還可以進(jìn)行深度對(duì)比,讓它評(píng)價(jià)幾家飯店各自的優(yōu)勢(shì)。

總的來說,不管什么任務(wù),都是靠它寫出來的代碼將人類指令轉(zhuǎn)化為精確的軟件工具操作來完成,整個(gè)過程也相當(dāng)快,1分鐘左右。
事實(shí)證明,在人工生成的9項(xiàng)基準(zhǔn)測(cè)試中,只有130億參數(shù)的NexusRaven-V2做到了58.2%的平均調(diào)用成功率,比GPT-4高出4個(gè)百分點(diǎn)(在零樣本情況下)。
其中,兩者在單個(gè)或并行函數(shù)調(diào)用這種簡單任務(wù)上的表現(xiàn)差不多。
但如果再單看復(fù)雜的嵌套函數(shù)調(diào)用任務(wù),NexusRaven-V2的成績比GPT-4表現(xiàn)得要更好,直接高出了7個(gè)百分點(diǎn)。

此外,能力測(cè)試還納入了9項(xiàng)操作現(xiàn)實(shí)世界軟件的任務(wù),結(jié)果是有6項(xiàng)NexusRaven-V2也都超過GPT-4。

除此之外,團(tuán)隊(duì)還介紹,函數(shù)的變量在發(fā)生改變時(shí),NexusRaven-V2還表現(xiàn)出比GPT-4更強(qiáng)的魯棒性。
值得一提的是,為了確保結(jié)果可重復(fù)以及標(biāo)準(zhǔn)化函數(shù)調(diào)用評(píng)估指標(biāo),以上測(cè)試基準(zhǔn)現(xiàn)在也一并公開發(fā)布。

以下是三種函數(shù)類型示例,有單個(gè)的、并行的,也有需要嵌套操作的。

大家可在Huggingface上獲取(具體入口可從NexusRaven-V2的GitHub界面獲得)。
如果你對(duì)NexusRaven-V2模型本身感興趣,團(tuán)隊(duì)也已經(jīng)發(fā)布了專門的Python包“nexusraven”,使用它就可以將模型與你已有的copilot或agent工具進(jìn)行無縫集成(Colab上有教程)。
One More Thing
最后,不得不說,自Llama之后,開源大模型賽道越來越有群星匯聚之勢(shì)。
這邊130億參數(shù)模型跟GPT-4掰上了手腕,在歐洲,“歐版OpenAI”Mistral AI最新估值已經(jīng)沖破20億美元,在短短六個(gè)月中增長了7倍多。
而就在最近,Mistral AI還靠一個(gè)磁力鏈接轟動(dòng)了整個(gè)大模型社區(qū):開源首個(gè)MoE大模型,也就是坊間傳聞中GPT-4采用的方案。
這不禁讓人好奇:開源模型,要崛起了嗎?















 
 
 


















 
 
 
 