馬斯克直播自動(dòng)駕駛「去小扎家」,45分鐘僅一次人工干預(yù):FSD V12不再會(huì)是“測試版”
馬斯克還真開著特斯拉“去小扎家”了,全程直播無剪輯!
不過說“開車”已經(jīng)不準(zhǔn)確,因?yàn)檫@回是新版FSD全程給馬斯克“代駕”,45分鐘里他本人只上手干預(yù)了一次。
也就是鋼鐵俠親自上陣,搞了一場自動(dòng)駕駛路測。
坐標(biāo)加州Palo Alto,從特斯拉新工程總部出發(fā),中途曾用谷歌地圖搜索扎克伯格家地址并導(dǎo)航。
圖片
馬斯克搭乘一輛老款Model S,硬件還是基于HW3的版本,但軟件已經(jīng)是未正式發(fā)布的新版FSD V12。
盡管畫質(zhì)不到480p,但這場??平臺上的直播,已吸引超1000萬人在線圍觀。
圖片
之所以備受矚目,倒不全是大家伙吃瓜“馬扎籠斗”的熱情太高,主要在于FSD V12被稱為特斯拉自動(dòng)駕駛最重要的一次升級:
實(shí)現(xiàn)了完全端到端(End-to-end)方案,輸入一端是圖像,輸出一端是對汽車的控制指令,中間完全由神經(jīng)網(wǎng)絡(luò)處理。
馬斯克自己的說法要更咋呼一點(diǎn):
光子進(jìn),行為出,和人類一樣。
試駕過程中,馬斯克多次表示現(xiàn)在的系統(tǒng)沒有一行規(guī)則和條件判斷代碼,不需要高清互聯(lián)網(wǎng)地圖。
比如,在經(jīng)過路邊一位騎行者時(shí),馬斯克就強(qiáng)調(diào)“沒有任何代碼聲明要給騎自行車的人讓行,沒有等待x秒之類的東西,只有(神經(jīng))網(wǎng)絡(luò)?!?/p>
This is all net, baby, nothing but net.
圖片
知名科技博主Robert Scoble表示:世界從今晚開始改變。
十年后,人們將把這一時(shí)刻定義為機(jī)器人的首次公開演示,機(jī)器人僅通過看視頻就學(xué)會(huì)在現(xiàn)實(shí)世界中移動(dòng)。
這是軟件構(gòu)建方式的范式轉(zhuǎn)換。
圖片
馬斯克也回復(fù)他:準(zhǔn)確的。
同樣令人驚訝的是,所需的推理計(jì)算功率只需要100W。
圖片
45分鐘路程僅一次干預(yù)
為了凸顯真實(shí)性,馬斯克從地圖上隨機(jī)選擇了目的地。
行駛沒一會(huì)兒,汽車來到了一條兩邊全部立滿紅色柱子的施工區(qū)域,對于這一“反?!甭窙r,車輛順暢通過:
圖片
在本次路程的第一個(gè)紅燈之處,Model S完美停住。
等待左轉(zhuǎn)燈綠起之后,它便通過無保護(hù)左轉(zhuǎn)(UPL)非常流暢地駛?cè)胱筮叺牧硪粭l馬路。
圖片
這是自動(dòng)駕駛領(lǐng)域中一個(gè)比較難的場景,要考慮到地面引導(dǎo)標(biāo)、左側(cè)行人、前方車輛等情況,馬斯克表示:
看直播可能看不太清楚,但車輛行駛得很平穩(wěn)。
大約5分鐘時(shí),車輛又碰上一片減速帶,Model S順利完成自動(dòng)減速。與此同時(shí),一輛自行車在右側(cè)飛速前進(jìn),但絲毫不會(huì)對它造成影響。
也禁住了環(huán)島的考驗(yàn)。只見在這樣的環(huán)形交叉路口,Model S先等前方的兩輛白色汽車通過之后,便立刻轉(zhuǎn)彎進(jìn)入:

大約10分鐘之后,車輛載著馬斯克到達(dá)了今天的第一個(gè)目的地,接著再前往下一個(gè)隨機(jī)地點(diǎn)。
期間汽車路過斯坦福大學(xué),人群變得多起來,Model S毫無壓力,并禮讓了行人:

由于直播逐漸進(jìn)入晚高峰時(shí)段,馬斯克也吐槽車開的有一點(diǎn)慢。
但一切都按照預(yù)期發(fā)生,直到19分左右,馬斯克進(jìn)行了第一次干預(yù),也是全程的唯一一次。
當(dāng)時(shí),想要直行的車輛在路口已經(jīng)等了很久紅燈,而在對面信號燈剛剛轉(zhuǎn)為左轉(zhuǎn)狀態(tài)時(shí),Model S竟突然跟著啟動(dòng)。
不過馬斯克和旁坐的工程師反應(yīng)迅速,連忙干預(yù)制止。
險(xiǎn)情結(jié)束,老馬也直言:
這就是FSD v12還未真正公開發(fā)布的原因。
后面剩余的25分鐘路程都順利結(jié)束,直播還展示了FSD的靠邊停車功能等等。
而在整個(gè)直播過程中,馬斯克反復(fù)強(qiáng)調(diào)得最多的一點(diǎn)就是:
無論是最開始遇到的紅色立柱、減速帶,還是后面遇到的騎行路人、環(huán)島路口,F(xiàn)SD系統(tǒng)都不是靠任何一行控制代碼來完成決策的。
相反,F(xiàn)SD只是看了非常多的視頻,然后完成了訓(xùn)練,得到了一個(gè)神經(jīng)網(wǎng)絡(luò)。
(特斯拉Autopilot的決策從2020年開始由編程邏輯轉(zhuǎn)為視頻訓(xùn)練的神經(jīng)網(wǎng)絡(luò),在FSD v12之前,v11版本控制堆棧中有超過30萬行C++代碼。)
像19分鐘的那次闖紅燈行為,馬斯克就告訴觀眾,解決方案本質(zhì)就是再多喂更多交通信號燈的視頻,尤其是左轉(zhuǎn)燈的,然后就會(huì)起作用。
當(dāng)然,胡亂投入大量視頻是不夠的,來自優(yōu)秀人類駕駛員的高質(zhì)量數(shù)據(jù)才是訓(xùn)練特斯拉Autopilot實(shí)現(xiàn)FSD的關(guān)鍵。
大量平庸的數(shù)據(jù)并不能改善駕駛,數(shù)據(jù)管理實(shí)際上相當(dāng)困難。我們有相當(dāng)多的軟件去控制系統(tǒng)究竟選擇什么數(shù)據(jù)、訓(xùn)練什么數(shù)據(jù)。
除了不靠任何代碼完成決策,馬斯克還強(qiáng)調(diào):
FSD V12不用時(shí)刻聯(lián)網(wǎng)就能完成一切。
當(dāng)然,如果有干預(yù)行為發(fā)生,系統(tǒng)會(huì)將它記錄下來并發(fā)回特斯拉進(jìn)行分析。
由于決策全部在本地進(jìn)行,特斯拉FSD用8個(gè)攝像頭以每秒36幀的速度進(jìn)行拍攝,但系統(tǒng)的計(jì)算速度其實(shí)可以更快,達(dá)到每秒50幀,只可惜相機(jī)的速度已經(jīng)到頭了。
不聯(lián)網(wǎng)進(jìn)行決策也意味著地圖也不用隨時(shí)更新,用馬斯克的話來說:
系統(tǒng)只需要坐標(biāo),就會(huì)自行找到位置。
另外值得注意的是,本次測試FSD V12的Model S安裝的還是HW3。
在HW3上解決L5級自動(dòng)駕駛之前,特斯拉可能不會(huì)在HW4車輛之上啟用FSD。這意味著HW4的FSD訪問權(quán)限可能推遲到2025年。
一萬張英偉達(dá)H100周一上線
作為知名的時(shí)間管理大師,馬斯克試駕途中還抽空語音連線了一個(gè)網(wǎng)絡(luò)討論會(huì)。
圖片
在這里他回答的問題和透露的重點(diǎn)內(nèi)容有:
為什么改用端到端方案,優(yōu)勢在哪?
馬斯克認(rèn)為“人類就是這樣運(yùn)作的”,人類用眼睛和生物神經(jīng)網(wǎng)絡(luò)開車,自動(dòng)駕駛用攝像機(jī)和數(shù)字神經(jīng)網(wǎng)絡(luò)開車是正確的通用解決方案。
雖然神經(jīng)網(wǎng)絡(luò)缺乏可解釋性,相應(yīng)的司機(jī)也經(jīng)常說不清楚如何做的決策,只是憑經(jīng)驗(yàn)。
乘客在做人類司機(jī)的出租車時(shí),也無法準(zhǔn)確知道司機(jī)在想什么。而特斯拉屏幕上顯示的畫面,就是自動(dòng)駕駛系統(tǒng)在 “想什么”的一個(gè)近似。
高端GPU將繼續(xù)短缺,世界進(jìn)入強(qiáng)算力依賴階段。
馬斯克透露AI訓(xùn)練主要還是用的英偉達(dá)硬件,特斯拉Dojo超算作為輔助,今年花了約20億美元在訓(xùn)練上面(大部分是硬件資產(chǎn))。
我認(rèn)為未來全人類80%-90%的算力都會(huì)用在神經(jīng)網(wǎng)絡(luò)上。
AI訓(xùn)練需要把算力集中在一個(gè)地方,避免數(shù)據(jù)傳輸帶寬的瓶頸,也會(huì)帶來很大的電力負(fù)擔(dān)。
馬斯克在這里還開了一個(gè)玩笑:Transformer架構(gòu)的神經(jīng)網(wǎng)絡(luò)需要越來越多的硬件Transformer。
比GPU更缺的是高速連接設(shè)備。
面對“擁有5000張H100是什么感覺?”的提問,馬斯克表示:說少了。
包含1萬張英偉達(dá)H100的新算力集群,正在24/7加急準(zhǔn)備中,周一(也就是今天)上線。
而且不像很多公司聲稱“擁有”算力其實(shí)是租的云計(jì)算服務(wù),特斯拉就是真的買了1萬張GPU自己搭系統(tǒng)。
在這樣的大規(guī)模集群中,設(shè)備之間的網(wǎng)絡(luò)連接非常關(guān)鍵,英偉達(dá)InfiniBand交換機(jī)可能會(huì)比GPU本身更缺。
……
直播結(jié)束后,特斯拉AI基礎(chǔ)設(shè)施主管Tim Zaman進(jìn)一步透露,即將上線的算力集群擁有200PB的熱緩存,比訓(xùn)練大模型的系統(tǒng)多幾個(gè)數(shù)量級。
也是一個(gè)讓很多從業(yè)者覺得不可思議的地方,比如GitHub前CEO。
圖片
Tim Zaman表示嘗試了很多云計(jì)算供應(yīng)商,但沒有一個(gè)足夠好,聘請了存儲(chǔ)系統(tǒng)架構(gòu)師來開發(fā)AI專用的分布式文件系統(tǒng)。
圖片
最后,回到此次直播測試。
不少網(wǎng)友不吝惜自己的贊美之詞,并希望能夠早日試駕一把。
圖片

還有網(wǎng)友調(diào)侃:
看起來FSD已經(jīng)準(zhǔn)備好迎接挑戰(zhàn)了,那么,不來試一把亞洲的終極boss之戰(zhàn)嗎?

be like this (手動(dòng)狗頭):
值得一提的是,這把直播除了秀特斯拉新版FSD,也是??直播功能的一場壓力測試。
至于最終也沒打上的“馬扎大戰(zhàn)”,似乎已經(jīng)不那么重要了。
馬斯克給自己打的圓場是“小扎在這片地區(qū)有8000多房產(chǎn),要是真找到他了我就去挑戰(zhàn)”。
參考鏈接:
[1]https://twitter.com/elonmusk/status/1695247110030119054[2]https://twitter.com/treb5475/status/1695289700620341311[3]https://twitter.com/tim_zaman/status/1695488119729238147?s=20[4]https://www.teslaoracle.com/2023/07/01/teslas-full-self-driving-version-12-will-not-be-beta-says-elon-musk/





























