李飛飛攜24人最強(qiáng)天團(tuán)打造「大世界模型」!Hinton站臺(tái)力挺,獲2.3億融資
AI教母李飛飛的創(chuàng)業(yè)公司W(wǎng)orld Labs,正式官宣啟動(dòng)!
3個(gè)月前,這家新晉AI獨(dú)角獸,在完成約1億美元融資后,估值10億美金。
剛剛,World Labs又獲2.3億美金新一輪融資。
這一次,新一輪融資由a16z、NEA和Radical Ventures領(lǐng)投,還有英偉達(dá)的風(fēng)投部門(mén)參與。
甚至,就連AI大牛Geoffrey Hinton、Jeff Dean、谷歌前CEO Eric Schmidt、LinkedIn聯(lián)創(chuàng)Reid Hoffman等人紛紛參投。
李飛飛和Hinton同時(shí)分別擔(dān)任Radical Ventures的科學(xué)合伙人和投資人
他們瞄準(zhǔn)的是,空間智能AI。
一直以來(lái),World Labs成立所專(zhuān)攻的領(lǐng)域,被蒙上了一層神秘的面紗。如今,一切真相大白。
官博介紹,World Labs的誕生就是為了構(gòu)建「大世界模型」(LWM),感知、生成3D世界,并與之進(jìn)行交互。
World Labs拒絕透露這一輪融資后的最新估值。
過(guò)去兩年里,文本提示圖像、視頻模型,以及LLM的興起,預(yù)示著AI在視覺(jué)領(lǐng)域的潛力。
但它們僅是冰山一角。
在李飛飛看來(lái),我們需要的空間智能的AI,能夠?qū)κ澜邕M(jìn)行建模,同時(shí)根據(jù)3D時(shí)空中物體/地點(diǎn)/交互進(jìn)行推理。
World Labs創(chuàng)始人團(tuán)隊(duì),左起依次為Ben Mildenhall、Justin Johnson、Christoph Lassner和李飛飛
那么,究竟什么是空間智能?
空間智能,計(jì)算機(jī)視覺(jué)下一個(gè)前沿
前段時(shí)間,李飛飛在一次活動(dòng)中,首次詳細(xì)揭秘了何謂「空間智能」:
視覺(jué)化為洞察,看見(jiàn)成為理解,理解導(dǎo)致行動(dòng)。
她將人類(lèi)智能歸結(jié)為兩大智能,一是語(yǔ)言智能,另一個(gè)便是空間智能。雖然語(yǔ)言智能備受關(guān)注,但空間智能將對(duì)AI產(chǎn)生重大的影響。
而在4月公開(kāi)的TED演講中,李飛飛也分享了自己關(guān)于空間智能的更多思考,同時(shí)預(yù)示著World Labs的目標(biāo)所在。
她表示,「所有空間智能的生物所具備的行動(dòng)能力,是與生俱來(lái)的。因?yàn)?,它能夠?qū)⒏兄c行動(dòng)進(jìn)行關(guān)聯(lián)」。
「如果想讓AI超越其自身當(dāng)前的能力,我們需要的是,不僅僅能夠看到、會(huì)說(shuō)話的AI,而是一個(gè)可以行動(dòng)的AI」。
就連英偉達(dá)高級(jí)計(jì)算機(jī)科學(xué)家Jim Fan稱(chēng),「空間智能,是計(jì)算機(jī)視覺(jué)和實(shí)體智能體的下一個(gè)前沿」。
正如World Labs的官博所闡述的那樣,人類(lèi)智能包含了諸多方面。
語(yǔ)言智能,可以讓我們通過(guò)語(yǔ)言與他們進(jìn)行交流和聯(lián)系。而其中最為基礎(chǔ)的便是——空間智能,能夠讓我們理解,并與周?chē)澜邕M(jìn)行互動(dòng)。
此外,空間智能具備了極強(qiáng)的創(chuàng)造力,可以將我們腦海中的畫(huà)面,在現(xiàn)實(shí)中呈現(xiàn)。
正是有了空間智能,人類(lèi)能夠推理、行動(dòng)和發(fā)明。從簡(jiǎn)單的沙堡到高聳的城市可視化設(shè)計(jì),都離不開(kāi)它。
在接受彭博最新采訪中,李飛飛表示,人類(lèi)的空間智能,實(shí)際上經(jīng)過(guò)了數(shù)百萬(wàn)年的演化而來(lái)。
這是一種理解、推理、生成,甚至在一個(gè)3D世界中互動(dòng)的能力。不論是你觀賞美麗的花朵,嘗試觸摸蝴蝶,還是建造一座城市,所有這些皆是空間智能的一部分。
不僅是人類(lèi),動(dòng)物身上也可以看到這一點(diǎn)。
那么,如何讓計(jì)算機(jī)也能具備空間智能的能力呢?其實(shí)我們已經(jīng)取得了巨大的進(jìn)步,過(guò)去十年AI領(lǐng)域的發(fā)展相當(dāng)振奮人心。
一句提示,AI生成圖像、視頻,真知還能講述故事。這些模型已經(jīng)以全新的方式,重塑人類(lèi)的工作和生活方式。
而我們僅是看到了GenAI革命前夜的第一章。
下一步,如何超越?
需要將這些能力,如何帶到3D領(lǐng)域。因?yàn)楝F(xiàn)實(shí)世界,就是3D的,同時(shí)人類(lèi)空間智能是建立在非?!冈沟睦斫夂筒僮?D的能力之上的。
打造「大世界模型」,從2D走向3D
以上,是李飛飛多年來(lái)的思考和預(yù)判。而World Labs這家公司,可以說(shuō)是很好地凝結(jié)了這些遠(yuǎn)見(jiàn)卓識(shí)。
他們的目標(biāo),簡(jiǎn)而言之,就是構(gòu)建具有空間智能的大世界模型(LWM),讓它可以感知、理解、推理,甚至生成3D世界,并能與其互動(dòng)。
此外,從公司發(fā)布的公告來(lái)看,World Labs絕不會(huì)止步于研究層面的探索。
公司目前有20名成員,不僅包括CV和圖形學(xué)領(lǐng)域的研究人才,還有系統(tǒng)工程、產(chǎn)品設(shè)計(jì)等職位,致力于在空間智能的基礎(chǔ)模型和產(chǎn)品之間構(gòu)建反饋閉環(huán),從而讓產(chǎn)品落地、服務(wù)用戶(hù)。
隨著時(shí)間的推移,預(yù)計(jì)將訓(xùn)練出功能更強(qiáng)大、能力更廣泛的模型,可以應(yīng)用于各種領(lǐng)域,與人們協(xié)同工作。
李飛飛在最新采訪中,也提出了類(lèi)似的預(yù)期:「這是一項(xiàng)非?;A(chǔ)的技術(shù),將對(duì)廣泛的用例產(chǎn)生影響,最終包括機(jī)器人和制造業(yè)。」
比如,如果用戶(hù)可以自定義物理變量來(lái)創(chuàng)建虛擬的3D空間,將會(huì)為藝術(shù)家、設(shè)計(jì)師、開(kāi)發(fā)者和工程師解鎖新的能力。
最終,GenAI將從2D的像素平面,走向完整的3D世界,無(wú)論是虛擬的還是現(xiàn)實(shí)的。
這些聽(tīng)起來(lái)似乎有些難以想象,但之World Labs之所以吸引到這么多大佬投資,其中一個(gè)重要原因就是李飛飛對(duì)技術(shù)的發(fā)展方向有準(zhǔn)確的預(yù)判。
早在2006年,專(zhuān)注于搞神經(jīng)網(wǎng)絡(luò)的Hinton還在坐冷板凳,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的熱潮遠(yuǎn)遠(yuǎn)沒(méi)有到來(lái)。
當(dāng)時(shí),李飛飛就帶領(lǐng)團(tuán)隊(duì)創(chuàng)建了ImageNet數(shù)據(jù)集,包含1500萬(wàn)張圖像,以及相應(yīng)的基準(zhǔn)測(cè)試ImageNet Challenge。
正是在ImageNet挑戰(zhàn)賽上,Hinton、Ilya Sutskever等人設(shè)計(jì)的AlexNet脫穎而出,讓2012年成為了「深度學(xué)習(xí)元年」。
李飛飛的遠(yuǎn)見(jiàn),可見(jiàn)一斑,也讓我們期待她能將「空間智能」變?yōu)楝F(xiàn)實(shí)。
AI大牛轉(zhuǎn)贊慶祝
對(duì)于World Labs正式成立的消息,李飛飛高徒Karpathy表示非常期待,也特地發(fā)推慶祝。
「The World Labs團(tuán)隊(duì)是頂尖的,我很期待看到他們將前沿研究應(yīng)用到3D AI中!」
Karpathy表示,在博士期間,他透與李飛飛和Justin Johnson共同度過(guò)了很多時(shí)光,充滿(mǎn)了美好的回憶。
當(dāng)時(shí),李飛飛是他的導(dǎo)師,也是他們「勇敢的領(lǐng)袖」;Justin和他一起撰寫(xiě)論文,這三位大佬共同奠基了斯坦福最著名的課程之一——CS231n的第一個(gè)版本。
CS231n課程全名為計(jì)算機(jī)視覺(jué)深度學(xué)習(xí)(Deep Learning for Computer Vision),李飛飛在今年的春季學(xué)期依舊開(kāi)設(shè)了這門(mén)課,和吳恩達(dá)的CS229一樣,是很多AI從業(yè)者的啟蒙課。
而在2017年首次開(kāi)設(shè)的時(shí)候,Andrj Karpathy、Justin Johnson和李飛飛共同擔(dān)任講師,YouTube上依舊能找到他們當(dāng)時(shí)上課的錄像視頻。
此外,英偉達(dá)高級(jí)科學(xué)家Jim Fan也同樣發(fā)推,祝賀自己的博士導(dǎo)師李飛飛成功創(chuàng)業(yè)。
2016~2021年Jim Fan在斯坦福大學(xué)讀博期間,就是在李飛飛的指導(dǎo)下開(kāi)展深度強(qiáng)化學(xué)習(xí)、機(jī)器人學(xué)、CV等領(lǐng)域的研究。
他在推文中表示,李飛飛在具身智能方面的觀點(diǎn)深刻影響了自己的博士階段和研究品味。他相信,空間智能將是CV和具身智能體的下一個(gè)前沿。
作為Justin Johnson和Chao-Yuan Wu之前在Meta FAIR的前同事,紐約大學(xué)助理教授謝賽寧也發(fā)推祝賀,并表示「空間智能必勝!」
四人創(chuàng)始團(tuán)隊(duì)
除了李飛飛,創(chuàng)始團(tuán)隊(duì)中的其他3人也都是CV和圖形學(xué)領(lǐng)域的技術(shù)專(zhuān)家。
Ben Mildenhall
Ben Mildenhall本科畢業(yè)于斯坦福大學(xué)的數(shù)學(xué)和計(jì)算機(jī)科學(xué)專(zhuān)業(yè),博士畢業(yè)于加州大學(xué)伯克利分校,曾在谷歌擔(dān)任研究科學(xué)家,谷歌學(xué)術(shù)引用量超過(guò)2.3萬(wàn)。
他博士期間師從Ren Ng,提出了著名的NeRF(神經(jīng)輻射場(chǎng))。
論文地址:https://arxiv.org/pdf/2003.08934
Justin Johnson
Justin Johnson在創(chuàng)業(yè)的同時(shí)還在擔(dān)任密歇根大學(xué)助理教授,他從加州理工學(xué)院獲得了數(shù)學(xué)和計(jì)算機(jī)科學(xué)的學(xué)士學(xué)位,博士畢業(yè)于斯坦福大學(xué),是李飛飛的學(xué)生。
他博士期間曾在谷歌、Facebook、雅虎實(shí)習(xí),畢業(yè)后到Meta FAIR擔(dān)任研究科學(xué)家,谷歌學(xué)術(shù)引用量超過(guò)3.4萬(wàn)。
讀博期間發(fā)表的這篇論文《Perceptual Losses for Real-Time Style Transfer and Super-Resolution》,單篇的引用量就超過(guò)了1.1萬(wàn)。
論文地址:https://arxiv.org/pdf/1603.08155
Christoph Lassner
Christoph Lassner本科畢業(yè)于德國(guó)奧格斯堡大學(xué)的信息學(xué)專(zhuān)業(yè),之后前往圖賓根大學(xué)以及Max Planck智能系統(tǒng)研究所攻讀博士。
畢業(yè)后,他曾在Meta和亞馬遜擔(dān)任研究科學(xué)家,之后在Epic Games領(lǐng)導(dǎo)研究團(tuán)隊(duì),專(zhuān)注于圖形學(xué)領(lǐng)域的3D重建和3D渲染技術(shù)。