OpenAI史上最大失誤:放走這位MIT學(xué)霸!美國AI「三朝元老」,現(xiàn)實韋小寶
AI算力競賽,比阿波羅更龐大,比曼哈頓更瘋狂!
Anthropic聯(lián)合創(chuàng)始人Tom Brown直言,AI基礎(chǔ)設(shè)施的規(guī)模超越阿波羅與曼哈頓計劃。
AGI算力投入正瘋狂膨脹,每年增速高達(dá)3倍。

明年,這個增長勢頭確定無疑;但到了2027到2028年,不確定性稍高。
Tom Brown,或許并不如奧特曼、馬斯克那樣家喻戶曉,但在AI圈,他是被低估的傳奇。
特別的是,他自學(xué)成才——從線性代數(shù)只考了B-的學(xué)生,硬是成長為推動通用人工智能突破的核心人物。
在OpenAI協(xié)助打造了GPT-3之后,他和OpenAI志同道合的同事,另立山頭,共同創(chuàng)立了Anthropic。

當(dāng)剛起步時,他們完全看不出會成功:
OpenAI擁有十億美元的資金,還有一群明星科學(xué)家;
而Anthropic只有七個聯(lián)合創(chuàng)始人(見下圖),硬著頭皮起步,連能否做出產(chǎn)品、產(chǎn)品會是什么樣都沒譜。

如今,Anthropic的Claude,已經(jīng)成為全球開發(fā)者的首選。
在Anthropic,他主導(dǎo)著他稱之為「人類史上最大規(guī)模的基礎(chǔ)設(shè)施建設(shè)」——一場比阿波羅登月、曼哈頓計劃更龐大的算力競賽。
在硅谷的「黃埔軍?!筜C的Lightcone Podcast「光錐播客」節(jié)目中,Tom Brown首次全面講述了自己的非典型人生歷程。他還分享了對年輕工程師的肺腑之言。

這場訪談完整回顧了Tom Brown的創(chuàng)業(yè)與研究歷程:
- 畢業(yè)即創(chuàng)業(yè),體會「狼性」文化;
- 在Grouper遭遇失敗,轉(zhuǎn)向AI自學(xué);
- 厚臉皮聯(lián)系Greg Brockman,進(jìn)入OpenAI;
- 參與GPT-3訓(xùn)練基礎(chǔ)設(shè)施,見證scaling law的力量;
- 與OpenAI團(tuán)隊決裂,創(chuàng)立Anthropic;
- 推出Claude,并在Claude 3.5/3.7迎來市場轉(zhuǎn)折;
- 打磨Claude Code,意外成為爆款應(yīng)用;
- 負(fù)責(zé)超大規(guī)模的算力與硬件基礎(chǔ)設(shè)施;
- 最后強調(diào):年輕人要勇敢冒險,追隨內(nèi)心使命,而不是追名逐利(chasing credentials)。
MIT學(xué)霸創(chuàng)業(yè)踩坑錄
主持人問:21歲從MIT畢業(yè),Tom進(jìn)入科技行業(yè),從2009年到今天,怎么一路走到聯(lián)合創(chuàng)辦Anthropic這樣重要的公司?

他追憶了他的來時路。
21歲從MIT的計算機專業(yè)畢業(yè)后,放棄巨頭offer,他加入朋友初創(chuàng)公司Linked Language,首次體驗「狼性」創(chuàng)業(yè)文化。
畢業(yè)即創(chuàng)業(yè),他直言這段經(jīng)歷改變了他的心態(tài):
在學(xué)校里,別人給我布置任務(wù),我就完成任務(wù),就像一只等著被喂食的狗。
但在創(chuàng)業(yè)公司,我們更像狼——必須自己去獵食,不然孩子會餓死。
這種轉(zhuǎn)變給了他勇氣直面更大更難的事。
之后,Tom去了移動廣告平臺Mopub,是第一號工程師。雖然想當(dāng)「狼」,但那時編程水平其實很差,他常常覺得自己跟不上。但這段經(jīng)歷讓他學(xué)到了如何把東西拓展。
之后,他卻連續(xù)踩坑:
- 第一次當(dāng)CEO:做「比Heroku更靈活」的DevOps平臺,結(jié)果連自己都說不清要做什么。
- 第二次做約會App:YC之父Paul Graham把他介紹給Grouper,被Tinder直接降維打擊,邊燒光錢邊靠「每周帶團(tuán)隊去相親」續(xù)命。

對Tom來說,Grouper的吸引力在于:本來,他非常笨拙、害羞,特別希望有個平臺能讓他在朋友陪伴下去認(rèn)識女生,這樣會更安全。
唯一比他還常去Grouper約會的人是Greg Brockman。他一度幾乎每周都在社交軟件上發(fā)「這周誰去Grouper?」。

Greg Brockman:OpenAI聯(lián)創(chuàng)、現(xiàn)任OpenAI主席
他們也成了好朋友,這也成為他之后進(jìn)入OpenAI的重要人脈。
在Grouper,他被搞得身心俱疲:創(chuàng)業(yè)的高潮讓人興奮,但低谷也極度痛苦。
回頭看,Tinder的方案比他們好得多,Grouper的使命被超越了。
業(yè)務(wù)下滑、收入減少,但Tom仍在招工程師,不斷推銷一個連自己都不再相信的夢想——那種感覺簡直像「死亡行軍」。
所以那段時間,他并沒有立刻投入研究,而是先「晃蕩」了一陣子。
比如,去做瑜伽、CrossFit,甚至花三個月造了一輛「藝術(shù)車」開去Burning Man藝術(shù)節(jié),洗去一身「班味」。
六月自學(xué)AI
「走后門」加入OpenAI
他猶豫了很久是否要轉(zhuǎn)型去做AI研究:
也許,我們這輩人就會遇到顛覆性人工智能(Transformative AI)的出現(xiàn),如果真發(fā)生,那是人類最重大的事件。
或許我能幫上點忙。但我大學(xué)線性代數(shù)才考了B-(差點是C+),這種水平能行嗎?
2015年,Tom離開了Grouper,但一直到一年后才加入了OpenAI。
那時,想要搞AI研究,大家覺得你必須是頂尖學(xué)霸才有資格。所以,他不確定能否勝任,加上之前創(chuàng)業(yè)有所成就,他一度想干脆再去做個新創(chuàng)業(yè)項目算了。
他的朋友們聽說他要去做AI研究,都覺得很怪,甚至有點糟糕。他們說:「AI安全?聽起來就像火星人口過剩一樣荒謬!」
他們都懷疑Tom不一定適合干這事。所以他足足猶豫了半年,才慢慢鼓起勇氣去嘗試。
玩了三個月后,他逼自己進(jìn)入「隱身學(xué)習(xí)模式」六個月,好讓自己有機會進(jìn)到頂尖實驗室。
當(dāng)時只有三個選擇:DeepMind、谷歌Brain、MIRI(機器智能研究院)。但他完全沒技術(shù)積累,只能靠自學(xué)。
那是2015年,深度學(xué)習(xí)剛火起來,他的主要計劃是:
- 在Coursera上自學(xué)機器學(xué)習(xí)課程;
- 做一些Kaggle項目;
- 讀《Linear Algebra Done Right》;
- 翻一本統(tǒng)計學(xué)教材;
- 甚至用YC校友點數(shù)買了一塊GPU,SSH遠(yuǎn)程上去跑實驗。
為了進(jìn)入OpenAI,他一開始就厚著臉皮去找Greg Brockman,畢竟那時OpenAI團(tuán)隊里大多是研究員,陣容強大。

OpenAI宣布成立的當(dāng)天,Tom就給Brockman發(fā)消息:「我線性代數(shù)才B-,但會一點工程,懂一些分布式系統(tǒng)。要是能幫上忙,哪怕掃地拖地我都愿意?!?/span>
Greg覺得懂機器學(xué)習(xí)又懂分布式系統(tǒng)的人太少了,Tom是個鬼才。
于是把Tom介紹給Pieter Abbeel,幫他整理學(xué)習(xí)計劃。

Pieter Abbeel是加州大學(xué)伯克利分校的教授,專攻機器人學(xué)習(xí)領(lǐng)域。2016年4月26日,他從伯克利休假,全職加入了OpenAI
后來,Tom每個月都去跟進(jìn)學(xué)習(xí),終于等到一個機會:OpenAI想做游戲環(huán)境,需要人幫忙搭建星際爭霸(StarCraft)環(huán)境。于是他加入項目。
當(dāng)時,OpenAI落腳在舊金山的Dandelion 巧克力工廠樓上,還有馬斯克承諾的十億美元資金,創(chuàng)業(yè)氛圍十足。
之后的一個關(guān)鍵節(jié)點是:他開始負(fù)責(zé)訓(xùn)練GPT模型的工程系統(tǒng)。
GPT-2還在TPU上訓(xùn)練,而GPT-3的重大突破是切換到GPU并使用更多算力。
在OpenAI干了一年,他中間離開去Google Brain待了一年,后來又回到OpenAI。

他恰好碰上GPT-3的訓(xùn)練期(2018–2019)。
那時大家已經(jīng)意識到Scaling Law的力量:只要用對方法,算力越多,智能就越強。
- Dario Amodei發(fā)表了著名的Scaling Law論文,證明了這一趨勢。
- Danny Hernandez的研究顯示,算法效率提升也在持續(xù)降低成本。
這兩股力量疊加,讓OpenAI看清未來幾年智能水平會爆炸式提升。
當(dāng)時他最震撼的是:那條直線跨越了12個數(shù)量級——從小模型到超級大模型,全都穩(wěn)定對齊在同一條線。
這么長的數(shù)量級跨度,在其他科學(xué)領(lǐng)域都沒見過。于是Tom完全轉(zhuǎn)向做scaling相關(guān)工作。
當(dāng)然,當(dāng)時學(xué)界很多人還在批評OpenAI,說「你們只是在堆GPU,太粗暴,沒技術(shù)含量」。有人甚至形容這就是「愚蠢但有效」的辦法。
如今看來,正是這條「笨辦法」推動了智能的飛躍。
分道揚鑣,自立門戶
Tom待過OpenAI、谷歌DeepMind和Anthropic,可謂美國AI界的「三朝元老」。
Tom原本是從GPT-3團(tuán)隊的一員,到底為何與OpenAI決裂?
這與與Amodei兄妹難脫關(guān)系。

當(dāng)時,OpenAI負(fù)責(zé)safety和scaling的團(tuán)隊向Daniela、Dario Amodei兄妹報告。
兩支團(tuán)隊合作默契,而且都堅信:
Scaling Law必然會帶來顛覆,最終人類將不得不把某種控制權(quán)移交給通用人工智能(AGI)。如果運氣好,它會與人類目標(biāo)保持一致,帶來順利的過渡;如果運氣不好,后果可能極為嚴(yán)重。
因此我們必須建立一個能夠承擔(dān)這種重任的機構(gòu)。
這就是他們自立門戶核心原因。
Tom坦承當(dāng)時并不確定這是對世界最好的選擇?;仡^看,結(jié)果證明這是明智的。
早期加入Anthropic的人都是抱著「使命」來的。他們本可以去更體面、更賺錢的地方,但選擇了Anthropic,因為他們相信這件事值得做。
這也成為公司文化的基石:前100名員工幾乎都是因使命而來。

Anthropic的Linkedin主頁介紹
正因如此,直到今天Anthropic已有2000多人,政治斗爭依舊沒能滲入。如果有人覺得某個行為偏離使命,他們會直接站出來指出來。
Claude拿下開發(fā)者,ChatGPT干瞪眼
大概在ChatGPT推出前9個月,Anthropic推出了第一個產(chǎn)品Slack機器人Claude 1。
初期,Anthropic還猶豫是否發(fā)布產(chǎn)品,專注于研究和基礎(chǔ)設(shè)施。ChatGPT的發(fā)布是一個催化劑,促使Anthropic推出API和Claude AI。
Claude 3.5 Sonnet特別是Claude Code是其關(guān)鍵轉(zhuǎn)折點,獲得了巨大的市場認(rèn)可。
2023年,幾乎所有創(chuàng)業(yè)者都在用OpenAI。
但到2024年,Claude 3.5尤其是Sonnet版本開始迅速搶占市場份額。
尤其在編程場景里,從個位數(shù)一路升到20%、30%,甚至現(xiàn)在可能80%、90%的創(chuàng)始人更偏好Claude。

國外某投行LLM報告:https://menlovc.com/perspective/2025-mid-year-llm-market-update/
就像OpenAI當(dāng)初沒準(zhǔn)備好ChatGPT的爆紅一樣,Claude 3.7 Sonnet同樣讓Anthropic驚訝——它意外解鎖了「智能體式編程」的能力。
每一次迭代,Claude的新能力驚艷眾人。
Claude Code的誕生
「心智切換」理論
YC的創(chuàng)業(yè)者調(diào)研顯示,大家在編程上更喜歡用Anthropic的模型,這種偏好遠(yuǎn)超基準(zhǔn)測試結(jié)果能解釋的范圍。為什么會這樣?是有意為之,還是自然涌現(xiàn)?
Tom覺得主要原因是——不「刷榜」。
其他大實驗室都有專門團(tuán)隊,盯著基準(zhǔn)測試題庫做針對性優(yōu)化,目標(biāo)就是讓分?jǐn)?shù)更好看。但我們沒有這樣的團(tuán)隊,所以反而避免了訓(xùn)練集和測試集的過擬合。
Anthropic內(nèi)部當(dāng)然也有自己的評測指標(biāo),但不會對外公布。團(tuán)隊主要盯著內(nèi)部benchmark去優(yōu)化,同時大量「dogfooding」(內(nèi)部自用)——比如讓Claude來加速自己的工程師工作,這是最高優(yōu)先級。
最近,Claude Code特別成功。主持人問起了它的起源,沒想到Claude Code最初只是個無心之作。
工程師Boris Cherny為了幫團(tuán)隊寫代碼,臨時拼湊出來的內(nèi)部小工具。
一開始,Anthropic的戰(zhàn)略是:只做API,不碰應(yīng)用。因為他們覺得,外部創(chuàng)業(yè)公司有無數(shù)點子,肯定更懂產(chǎn)品。所以他們?nèi)Π袮PI打磨到最好,讓開發(fā)者去構(gòu)建應(yīng)用。
結(jié)果Claude Code出乎意料地跑了出來,作為一個產(chǎn)品,它居然比市面上的替代品更好用。
對此,Tom有個「心智切換」理論——把Claude本身當(dāng)成「用戶」來對待。
- 在Linked Language,用戶是老師;
- 在Grouper,用戶是紐約的單身青年;
- 在Claude Code,用戶既是開發(fā)者,也是Claude自身。
所以團(tuán)隊的思路是:給Claude配備最合適的工具和上下文,讓它更高效地幫助人類完成任務(wù)。
這是一種「以模型為中心」的思維方式,對Anthropic而言卻格外自然。
人生忠告
如果今天有一個「年輕版的你」——20多歲,正想進(jìn)入AI領(lǐng)域,想搭上這班快車,你會給他什么建議?
Tom會說——要敢于冒更多風(fēng)險。
選擇那些即使失敗,朋友們也會覺得你很酷、很欽佩的項目?;蛘?,你理想中的那個更好的自己,會為之驕傲的事情。去做這樣的事,而不是一味追逐所謂的「安全路徑」。
主持人最后問了大學(xué)生常見的困惑:到底要不要繼續(xù)上學(xué)?未來還有沒有工作?世界會怎么變?
Tom的建議是:
不要太在意外部的標(biāo)簽(比如學(xué)位、證書、去大廠)。
內(nèi)在驅(qū)動比外在驅(qū)動更重要。
如果只是為了拿一個文憑,或者去FAANG公司(Facebook、Apple、Amazon、Netflix、Google)混一份工作,那已經(jīng)沒什么意義了。
現(xiàn)在的世界變化太快,靠「傳統(tǒng)路徑」已經(jīng)不再是優(yōu)勢。真正的價值,是你能不能在朋友心中、在自己心里,都覺得「我做了一件了不起的事情」。































