NeurIPS神仙打架:李飛飛180頁(yè)P(yáng)PT談視覺(jué)智能,Bengio同OpenAI員工吵架,何愷明談AI宿命論
李飛飛最新采訪來(lái)了,繼續(xù)延伸她在NeurIPS有關(guān)視覺(jué)智能的話題。
她表示,解決空間智能問(wèn)題是邁向全面智能化的基礎(chǔ)和關(guān)鍵一步。
不過(guò)從現(xiàn)場(chǎng)傳出的NeurIPS演講PPT中竟然有寫(xiě):AI將取代人類?!
這究竟是怎么一回事?!
有網(wǎng)友表示,當(dāng)她看到這頁(yè)時(shí),她的表情be like:
有一說(shuō)一,今年NeurIPS好不熱鬧,大佬們聚在一起,就是容易制造各種話題(Doge)。
比如,疑似Bengio和OpenAI o1的人吵起來(lái)了。
何愷明竟然探討起了AI宿命論???
來(lái)來(lái)來(lái),來(lái)看看一個(gè)吃瓜匯總。
李飛飛180頁(yè)P(yáng)PT談視覺(jué)智能
今年李飛飛在NeurIPS演講的話題是《從看到到做:攀登視覺(jué)智能的階梯》。
她自曝準(zhǔn)備了180頁(yè)ppt,從各種路透圖來(lái)看,確實(shí)是干貨滿滿。
而在最新IEEE Spectrum采訪中,她進(jìn)一步揭示了相關(guān)細(xì)節(jié)。(該采訪是在NeurIPS演講前進(jìn)行)
采訪實(shí)錄:
Q:為什么演講題目是“攀登視覺(jué)智能的階梯(Ascending the Ladder of Visual Intelligence)”?
李飛飛:我認(rèn)為,直覺(jué)告訴我們,智能具有不同的復(fù)雜度和精密度。在演講中,我想傳達(dá)這樣一種感覺(jué):在過(guò)去的幾十年里,尤其是過(guò)去十多年的深度學(xué)習(xí)革命中,我們?cè)谝曈X(jué)智能方面所取得的成就令人驚嘆。我們?cè)絹?lái)越擅長(zhǎng)使用這項(xiàng)技術(shù)。我還受到了 Judea Pearl 的“因果關(guān)系階梯”的啟發(fā)。(收錄于2020年出版的《the Book of Why》)
(這里插一嘴,Judea Pearl本人還特意糾正了一下,他表示因果關(guān)系階梯所定義的等級(jí)是第一定律的數(shù)學(xué)結(jié)果,而不是一種判斷性的建構(gòu)。)
李飛飛:演講還有一個(gè)副標(biāo)題,即“從看到到做(From Seeing to Doing)”。這是人們沒(méi)有足夠重視的一點(diǎn):“看 ”都與互動(dòng)和 “做 ”密切相關(guān),無(wú)論是對(duì)于動(dòng)物,還是AI Agents來(lái)說(shuō)都是如此。這與語(yǔ)言是不同的。語(yǔ)言從根本上說(shuō)是一種交流工具,用來(lái)傳遞思想。在我看來(lái),這些都是非常互補(bǔ)但同樣深刻的智能模式。
Q:你的意思是說(shuō),我們會(huì)對(duì)某些景象做出本能的反應(yīng)?
李飛飛:我說(shuō)的不僅僅是本能。如果你看一下感知力的進(jìn)化和動(dòng)物智力的進(jìn)化,就會(huì)發(fā)現(xiàn)這兩者之間有著深刻的聯(lián)系。每當(dāng)我們能夠從環(huán)境中獲得更多信息時(shí),進(jìn)化的力量就會(huì)推動(dòng)能力和智力的發(fā)展。如果你不能感知環(huán)境,你與世界的關(guān)系就會(huì)非常被動(dòng);你是吃還是被吃,都是非常被動(dòng)的行為。但是,一旦你能夠通過(guò)感知從環(huán)境中獲取線索,進(jìn)化的壓力就會(huì)真正增強(qiáng),從而推動(dòng)智力向前發(fā)展。
Q:你認(rèn)為這就是我們創(chuàng)造更深入的機(jī)器智能的方式嗎?讓機(jī)器感知更多的環(huán)境?
李飛飛:我不知道 “深度 ”是不是我想用的形容詞。我認(rèn)為我們正在創(chuàng)造更多的能力。我認(rèn)為它正變得越來(lái)越復(fù)雜,越來(lái)越有能力。我認(rèn)為,解決空間智能問(wèn)題是邁向全面智能化的基礎(chǔ)和關(guān)鍵一步,這是絕對(duì)正確的。
Q:我看過(guò)世界實(shí)驗(yàn)室的演示。你為什么要研究空間智能并構(gòu)建這些三維世界?
李飛飛:我認(rèn)為空間智能是視覺(jué)智能的發(fā)展方向。如果我們真的要破解視覺(jué)問(wèn)題,并將其與做事聯(lián)系起來(lái),那么有一個(gè)極其簡(jiǎn)單、一目了然的事實(shí):世界是三維的。我們生活的世界不是平面的。我們的物理Agent,無(wú)論是機(jī)器人還是設(shè)備,都將生活在三維世界中。就連虛擬世界也變得越來(lái)越3D化。如果你與藝術(shù)家、游戲開(kāi)發(fā)者、設(shè)計(jì)師、建筑師、醫(yī)生交談,即使他們是在虛擬世界中工作,其中大部分也是三維的。如果你能花點(diǎn)時(shí)間認(rèn)識(shí)到這個(gè)簡(jiǎn)單而深刻的事實(shí),那么毫無(wú)疑問(wèn),解決3D智能問(wèn)題就是根本所在。
一旦你尊重了世界的三維性,很多事情就自然而然地發(fā)生了。例如,在我們發(fā)布在社交媒體上的一個(gè)視頻中,籃球被投放到一個(gè)場(chǎng)景中。因?yàn)樗侨S的,所以你可以擁有這種能力。如果場(chǎng)景只是 2D 生成的像素,籃球?qū)o(wú)處可去。
Q:或者,就像Sora中那樣,它可能會(huì)去到某個(gè)地方,但隨后就消失了。在你嘗試推進(jìn)這項(xiàng)技術(shù)的過(guò)程中,最大的技術(shù)挑戰(zhàn)是什么?
李飛飛:沒(méi)有人解決過(guò)這個(gè)問(wèn)題,對(duì)吧?這非常非常難。在世界實(shí)驗(yàn)室的演示視頻中,你可以看到我們將一幅梵高的畫(huà)作,以一致的風(fēng)格生成了它周圍的整個(gè)場(chǎng)景:藝術(shù)風(fēng)格、燈光,甚至是那個(gè)社區(qū)會(huì)有什么樣的建筑。如果你轉(zhuǎn)過(guò)身去,它就變成了摩天大樓,那就完全沒(méi)有說(shuō)服力了,對(duì)嗎?它必須是 3D 的。你必須進(jìn)入其中。所以它不僅僅是像素。
Q:你能說(shuō)說(shuō)你用來(lái)訓(xùn)練它的數(shù)據(jù)嗎?
李飛飛:很多。
Q:你們?cè)谟?jì)算負(fù)擔(dān)方面遇到過(guò)技術(shù)挑戰(zhàn)嗎?
李飛飛:計(jì)算量很大。這是公共部門負(fù)擔(dān)不起的計(jì)算量。這也是我很高興能休假,以私營(yíng)部門的方式來(lái)做這件事的部分原因。我的親身經(jīng)歷強(qiáng)調(diào)了在獲得充足資源的情況下進(jìn)行創(chuàng)新的重要性。
知識(shí)的發(fā)現(xiàn)需要資源的支持,對(duì)吧?在伽利略時(shí)代,是最好的望遠(yuǎn)鏡讓天文學(xué)家觀測(cè)到了新的天體。是虎克意識(shí)到放大鏡可以變成顯微鏡,發(fā)現(xiàn)了細(xì)胞。每一次新技術(shù)工具的出現(xiàn),都有助于知識(shí)的探尋。而現(xiàn)在,在人工智能時(shí)代,技術(shù)工具涉及計(jì)算和數(shù)據(jù)。我們必須認(rèn)識(shí)到這一點(diǎn)。
Q:假設(shè)我們能讓人工智能系統(tǒng)真正理解三維世界,這會(huì)給我們帶來(lái)什么?
李飛飛:它將為人們釋放大量的創(chuàng)造力和生產(chǎn)力。我希望能以更高效的方式設(shè)計(jì)我的房子。我知道,許多醫(yī)療用途都涉及到理解一個(gè)非常特殊的三維世界,那就是人體。我們總在談?wù)撐磥?lái)人類將創(chuàng)造機(jī)器人來(lái)幫助我們,但機(jī)器人是在三維世界中航行的,它們需要空間智能作為大腦的一部分。我們也在談?wù)撎摂M世界,它能讓人們參觀景點(diǎn)、學(xué)習(xí)概念或娛樂(lè)。這些虛擬世界使用三維技術(shù),尤其是混合技術(shù),也就是我們所說(shuō)的 AR(增強(qiáng)現(xiàn)實(shí)技術(shù))。我很想戴著一副眼鏡在國(guó)家公園里漫步,它能為我提供有關(guān)樹(shù)木、道路和云彩的信息。我還想通過(guò)空間智能學(xué)習(xí)不同的技能。
Q:什么樣的技能?
李飛飛:我舉個(gè)蹩腳的例子,如果我在高速公路上爆胎了,我該怎么辦?現(xiàn)在,我打開(kāi)了一個(gè) “如何換輪胎 ”的視頻。但如果我能戴上眼鏡,看到我的車發(fā)生了什么,然后在指導(dǎo)下完成這個(gè)過(guò)程,那就很酷了。但這只是個(gè)蹩腳的例子。你可以考慮烹飪,可以考慮雕刻—有趣的事情。
Q:你認(rèn)為我們?cè)谟猩昴茉谶@方面取得多大進(jìn)展?
李飛飛:哦,我認(rèn)為這將在我們有生之年實(shí)現(xiàn),因?yàn)榭萍歼M(jìn)步的步伐真的很快。你已經(jīng)看到了過(guò)去 10 年所帶來(lái)的變化。這無(wú)疑預(yù)示著下一步會(huì)發(fā)生什么。
今年NeurIPS好熱鬧
NeurIPS整個(gè)會(huì)議期間,可以說(shuō)是好不熱鬧。
比如,Bengio和OpenAI的人吵起來(lái)了。
據(jù)在場(chǎng)的人爆料,在今年因果關(guān)系小組討論中,OpenAI o1的主創(chuàng)表示,我們最終應(yīng)該訓(xùn)練Agent來(lái)優(yōu)化對(duì)世界的理解,來(lái)解決科學(xué)問(wèn)題。
Bengio還有一位谷歌AGI安全研究員Tom Everitt則指出這樣做很可怕!他們表示不應(yīng)該制造這樣強(qiáng)大的Agent,還有其他方法可以增強(qiáng)人類的能力,并進(jìn)行科學(xué)研究,比如讓模型學(xué)習(xí)因果圖。
而就在剛才,Bengio還進(jìn)一步回應(yīng)了,再次強(qiáng)調(diào)了AI Agent潛在的風(fēng)險(xiǎn)。
如果我們不解決調(diào)整和控制問(wèn)題,隨著我們賦予系統(tǒng)越來(lái)越多的代理權(quán),人工智能的風(fēng)險(xiǎn)將繼續(xù)增長(zhǎng)。在此之前,我們需要在科學(xué)和政策兩方面取得重大進(jìn)展。
而何愷明竟然探討起了AI宿命論?!
據(jù)熱心網(wǎng)友們的爆料,他是在被問(wèn)到AI屬于發(fā)明還是發(fā)現(xiàn)的時(shí)候。
他表示這要看你相不相信宿命論了。(Doge)
除此之外,他在演講中探討了AI未來(lái)的發(fā)展:Super-human AI?
據(jù)小紅書(shū)網(wǎng)友爆料,他提到一個(gè)有意思的觀點(diǎn),他將人類比作大模型的傳感器:
人類感知,理解,壓縮了世界的所有的知識(shí)并用文本和語(yǔ)言記錄下來(lái)。大語(yǔ)言模型吸取,學(xué)習(xí)這些內(nèi)容并將其建模為一個(gè)強(qiáng)大而豐富的空間。但是就像你只用RGB觀測(cè)宇宙一樣,總會(huì)有紫外,紅外這樣看不到,看不清的東西。
△授權(quán)自博主@時(shí)間煮雨我主Q
好了,NeurIPS期間還有沒(méi)有發(fā)生什么有意思的事情,歡迎小伙伴們跟我們爆料。