偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

算力投入超阿波羅登月!Anthropic聯(lián)創(chuàng):Claude沒有刷榜水軍!CC擊敗Cursor、MCP成功,秘訣在于把模型當(dāng)用戶!

原創(chuàng) 精選
人工智能
對于創(chuàng)業(yè)者來說,如何在 API 之上構(gòu)建自己的產(chǎn)品,又不擔(dān)心被大模型干掉?在最新一期播客里,Anthropic 聯(lián)合創(chuàng)始人?Tom Brown?分享了 Claude Code 的成長故事。

編輯 | 伊風(fēng)

出品 | 51CTO技術(shù)棧(微信號:blog51cto)

Claude Code 為什么能在市場上戰(zhàn)勝 Cursor?

對于創(chuàng)業(yè)者來說,如何在 API 之上構(gòu)建自己的產(chǎn)品,又不擔(dān)心被大模型干掉?

在最新一期播客里,Anthropic 聯(lián)合創(chuàng)始人 Tom Brown 分享了 Claude Code 的成長故事。

圖片圖片

這款最初只是工程師 Boris Cherny 為了方便自己和團(tuán)隊(duì)寫的內(nèi)部工具,如今卻成長為一款年化營收約 4 億美元的 AI 編程明星。

“我們的轉(zhuǎn)折點(diǎn)在于:把 Claude 本身當(dāng)作用戶來設(shè)計(jì)工具。就像我早期做社交應(yīng)用 Grouper 時,用戶是紐約的年輕單身群體;現(xiàn)在的用戶是開發(fā)者,同時也是 Claude 自己?!?/span>

Tom 總結(jié)說,Claude Code 和 MCP 的成功,都源于這種“模型中心化”的視角

這是一個值得AI創(chuàng)業(yè)者深挖的方向:為模型作為“用戶”去開發(fā)工具。

從本質(zhì)上看,Claude Code 是在賦能模型,讓 Claude 成為一個靠譜的“結(jié)對編程伙伴”或“初級工程師”。

而如果放眼整個商業(yè)社會,編程只是無數(shù)任務(wù)的一小部分。未來,如何去“教練”Claude 或其他模型,幫它們勝任更多企業(yè)工作場景,依然有著巨大的空間。

除了講述 Claude Code 的起源,Tom 還分享了許多幕后故事:

  • 自學(xué)六個月轉(zhuǎn)向AI研究:作為GPT-3團(tuán)隊(duì)的AI老將,Tom自曝線性代數(shù)才得了AC+,靠著六個月的AI自學(xué)計(jì)劃,他主動私信總裁哥Greg表示愿從打雜做起,最后成功入職了OpenAI 工作。
  • 堅(jiān)決不搞刷榜:不同于其他AI實(shí)驗(yàn)室,Claude 沒有專門給“基準(zhǔn)測試”刷分的團(tuán)隊(duì)。他們注重的是在內(nèi)部基準(zhǔn)上的進(jìn)步,但這些benchmark不會對外發(fā)布。
  • 算力擴(kuò)張:Anthropic正處在人類史上最大規(guī)模的基礎(chǔ)設(shè)施建設(shè)進(jìn)程中,算力投入幾乎每年增長 3 倍。
  • 人格設(shè)計(jì):團(tuán)隊(duì)希望 Claude 成為一個“優(yōu)秀的世界旅行者”,能和不同背景的人交流,讓對話對象都覺得愉快。
  • 文化根基:Anthropic 已擴(kuò)張至 2000 名員工,卻依舊高效、少“政治內(nèi)耗”,關(guān)鍵在于最初 100 名員工都因使命而來。

以下是經(jīng)過整理的播客內(nèi)容,enjoy:

1.不做大廠螺絲釘,去創(chuàng)業(yè)公司當(dāng)一只“狼”

主持人Garry Tan

歡迎回到《The Light Cone》的新一期。今天我們請到一位特別的嘉賓——Anthropic 聯(lián)合創(chuàng)始人 Tom Brown。

聯(lián)創(chuàng)Tom Brown

很高興能來。

主持人Garry Tan

Tom,很多觀眾都想知道,你 21 歲剛從 MIT 畢業(yè)就進(jìn)入科技行業(yè)。怎么從 2009 年的那個起點(diǎn),一路走到今天,參與到像 Anthropic 這樣重要的公司?

聯(lián)創(chuàng)Tom Brown

2009 年夏天,我的兩個朋友創(chuàng)建了 Linked Language。他們當(dāng)時看到我們另一位朋友 Kyle 做了一家 YC 公司,所以覺得這是可以嘗試的路徑。他們先開始了,我當(dāng)時是第一個員工。你們那會兒也讓我一起參加晚餐啥的。我本來也可以去大廠當(dāng)軟件工程師,可能那樣會學(xué)到更多純粹的工程技能。但選擇加入創(chuàng)業(yè)公司,沒有人告訴你該做什么,我們必須自己去摸索——否則公司會“自然死亡”。

在學(xué)校時,我的感覺是有人分配任務(wù),我去完成,就像小狗等著有人把食物放進(jìn)碗里。而在那家公司,更像是一群狼——必須自己去獵食,否則孩子們會餓死。我覺得這種心態(tài)的轉(zhuǎn)變,是我嘗試去做更大、更激動人心事情時最寶貴的財(cái)富。

主持人Garry Tan

是啊,大公司只會教你如何在大公司工作,而做“狼”要有意思多了。

聯(lián)創(chuàng)Tom Brown

對。

主持人Harj Taggar

那你是怎么從在朋友創(chuàng)業(yè)公司工作,到自己開創(chuàng)公司呢?

聯(lián)創(chuàng)Tom Brown

Linked 后來我們運(yùn)營了一陣,我又回去讀書。之后離開學(xué)校時加入了一家叫 Mopo 的公司。

主持人Harj Taggar

是做廣告的。

聯(lián)創(chuàng)Tom Brown

對,我是第一位工程師。我那時很想當(dāng)一只“狼”,但編程水平其實(shí)很掙扎。我知道自己想做更多事,但不知道怎么做。那段經(jīng)歷算是讓我見識了怎么把東西做規(guī)?;?/span>

2012 年冬天,我大學(xué)里最聰明的一個朋友拉我一起去做 YC 公司。我們當(dāng)時做的是 Solid Stage,那是在 Docker 出現(xiàn)之前,目標(biāo)是簡化 DevOps。說白了就是做一個比 Heroku 更靈活的東西——但其實(shí)就意味著更復(fù)雜的 Heroku。我記得我們來你們這兒面試時,評審們其實(shí)也不太明白我們要做啥,說實(shí)話我們自己也沒完全搞明白。

主持人Garry Tan

在嘗試新事物時,這其實(shí)很常見。

聯(lián)創(chuàng)Tom Brown

對,但我們算是比較特殊。面完試后我們開車回舊金山時,TLB 在白板上寫了一個憤怒的皺眉表情,還問:你們到底要做什么?于是我們又去解釋。也許我們解釋得還行,或者他覺得我們雖然還不懂,但可能會慢慢搞明白。只是做到一半,我還是覺得不清楚我們到底要造什么,以及怎么把使命和它綁定起來,所以最后我選擇離開。PG 把我介紹給了 Michael Waxman。

主持人Harj Taggar

他是 Grouper 的創(chuàng)始人之一。

主持人Garry Tan

對,Grouper 是個交友應(yīng)用,但很特別——不是一對一,而是“三男三女”組隊(duì)。這還是在 AI 興起前,匹配完全靠人工。大家見面去酒吧,結(jié)果就很熱鬧。

聯(lián)創(chuàng)Tom Brown

對,總會鬧出動靜,但不一定每次都開心。我自己上過幾次組。Grouper 吸引我的原因很個人:我以前是個非常社恐的孩子,我想要一個方式,能讓我和朋友一起去社交,尤其是能和女生說話,而且是安全的氛圍。那時招聘員工也很關(guān)鍵,我負(fù)責(zé)所有工程面試。順便說一下,唯一比我去 Grouper 還頻繁的人是 Greg Brockman。他當(dāng)時好像每周都去一次,還會在 Slack 或 HipChat 上發(fā)帖。

主持人Harj Taggar

那時候他常常在外面跑吧?

聯(lián)創(chuàng)Tom Brown

是的,他那會兒在 Stripe,也可能在 Recur,但他確實(shí)有個階段,每周都會發(fā)“我又去 Grouper 了”。所以我和 Greg 關(guān)系變近,這后來成了我和 OpenAI 的聯(lián)系點(diǎn)。

2.轉(zhuǎn)型做AI,進(jìn)OpenAI九個月都沒碰機(jī)器學(xué)習(xí)

主持人Diana Hu

所以,你從 MIT CS 畢業(yè)后,21 歲起步,一路在這些 YC 公司當(dāng)早期員工,后來自己創(chuàng)業(yè),幾年后又加入新公司。能不能說說最后是怎么走到 Anthropic 的?這條路徑很長,但也很厲害。

主持人Garry Tan

聽起來跟 Greg 的那次結(jié)識是個關(guān)鍵節(jié)點(diǎn)。后來你成了 OpenAI 前二十幾個員工之一,對吧?

聯(lián)創(chuàng)Tom Brown

是的。我 2014 年 6 月離開 Grouper,大約一年后加入了 OpenAI。

我當(dāng)時鼓起勇氣想要轉(zhuǎn)型,嘗試去學(xué)習(xí) AI 研究。我覺得,也許在我們有生之年會誕生“變革性的 AI”,如果真發(fā)生了,那將是最重要的事?;蛟S我也能幫上點(diǎn)忙。但另一方面,我大學(xué)線性代數(shù)才拿了個 AB-,所以當(dāng)時覺得,能參與 AI 研究的人必須是頂尖天才,我很不確定自己到底能不能幫上什么忙。加上我在創(chuàng)業(yè)上也算有些成功,所以內(nèi)心也常想:與其重新學(xué)習(xí),不如再去做一家創(chuàng)業(yè)公司算了。

主持人Harj Taggar

我感覺在那個時期,去做 AI 研究并不被視為一件“嚴(yán)肅的事”。當(dāng)時大家都在創(chuàng)業(yè)、做一些非常務(wù)實(shí)的東西。你的朋友們會覺得“哇,很酷啊,你要去搞 AI”嗎?

聯(lián)創(chuàng)Tom Brown

其實(shí)不是,我的朋友們大多覺得“聽上去很奇怪,甚至不太好”。就像他們覺得“AI 安全”聽起來不靠譜,差不多等于“火星人口過?!蹦欠N話題。他們也懷疑我能不能勝任。所以那段時間我一直搖擺不定,差不多花了六個月才鼓起勇氣。

主持人Harj Taggar

那你當(dāng)時具體在做什么?比如說,你在讀研究論文嗎?

聯(lián)創(chuàng)Tom Brown

是啊,最開始其實(shí)我只是閑逛。我還搞了輛藝術(shù)車,參加了 Burning Man(“泰坦尼克號”主題車)。

對,那段時間我花了一個夏天,大概三個月。因?yàn)樵?Grouper 后期,我已經(jīng)非常疲憊了。創(chuàng)業(yè)公司的高潮很高,但低谷也很低。我們業(yè)務(wù)不成功,營收在下滑,但我的主要工作還是招聘工程師——讓我推銷一個我自己都不再相信的愿景。

主持人Garry Tan

聽起來就像“死亡行軍”。

聯(lián)創(chuàng)Tom Brown

是的,所以我真的身心俱疲。于是我告訴自己:“Tom,放松一下,去練練瑜伽,做點(diǎn) CrossFit,造輛藝術(shù)車?!?/span>

主持人Garry Tan

那回頭看 Grouper,你會怎么總結(jié)?當(dāng)時吸引了那么多聰明人,一開始增長很快,但后來停滯甚至下滑,到底出了什么問題?

聯(lián)創(chuàng)Tom Brown

我覺得一開始,我們的競爭對手是 OkCupid。

主持人Garry Tan

全都是網(wǎng)頁版。

聯(lián)創(chuàng)Tom Brown

對,都是網(wǎng)頁式的。我們要解決的主要問題是:主動去和陌生人搭話很難,很可能被拒絕,被認(rèn)為奇怪。我們通過“盲配”來解決這個問題。但在 Grouper 運(yùn)營期間,Tinder 出現(xiàn)了。Tinder 解決了同樣的問題,但方式更好:雙方都要先表示有興趣,才會匹配,這樣就不用擔(dān)心被拒絕了。那確實(shí)是一個更好的解決方案。Tinder 做得很棒,“刷屏黨”們也做得很棒,他們比我們更好地解決了我們試圖解決的那個問題。

主持人Harj Taggar

那你后來是什么時候,真正認(rèn)真對待 AI 的?

聯(lián)創(chuàng)Tom Brown

我大概玩了三個月,做些有趣的事,然后錢也花完了,生活費(fèi)不夠了。我想,要想有機(jī)會拿到 AI 相關(guān)的工作,至少需要六個月的自學(xué)。那時候能去的地方就是 DeepMind、Google Brain,還有 MIRI。這三個是我考慮的目標(biāo)。但我完全沒有技能,所以我給自己定了六個月自學(xué)的計(jì)劃,不想成為團(tuán)隊(duì)的拖累,而是能真正幫上忙。

主持人Diana Hu

那你能具體說說自學(xué)的過程嗎?因?yàn)楝F(xiàn)在也有很多 20 多歲的軟件工程師想轉(zhuǎn)型做 AI 研究。那六個月你是怎么安排的?畢竟你之前說過線性代數(shù)才 AB-。

聯(lián)創(chuàng)Tom Brown

可能是 AC+ 吧(笑)。

主持人Diana Hu

那也挺不錯的。

聯(lián)創(chuàng)Tom Brown

最后結(jié)果還行。我先接了 Twitch 的合同工,賺到夠支撐六個月的資金。做了三個月合同工之后,我就開始計(jì)劃自學(xué)。我不覺得這套方法現(xiàn)在還合適,但在 2015 年,大概是這樣:先上一門 Coursera 的機(jī)器學(xué)習(xí)課程,嘗試做一些 Kaggle 項(xiàng)目,讀《Linear Algebra Done Right》,還準(zhǔn)備了一本統(tǒng)計(jì)學(xué)教材。那時候 YC 校友有優(yōu)惠,我就買了張 GPU 卡,然后遠(yuǎn)程 SSH 上去跑這些課程。

主持人Diana Hu

這已經(jīng)是在 AlexNet 之后了吧?

聯(lián)創(chuàng)Tom Brown

對,AlexNet 之后。所以我主要學(xué)的是圖像分類,基本就是課程會教的那些內(nèi)容。

主持人Diana Hu

那你是怎么拿到 OpenAI 的工作的?畢竟當(dāng)時大多數(shù)都是研究員,團(tuán)隊(duì)很強(qiáng),而你是少數(shù)工程師之一。

聯(lián)創(chuàng)Tom Brown

OpenAI 一宣布成立,我就給 Greg 發(fā)消息說:“我很想幫忙。雖然線性代數(shù)才 AB-,但我有一些工程經(jīng)驗(yàn),做過分布式系統(tǒng)。如果需要的話,我甚至可以打雜。我只想?yún)⑴c?!?Greg 回我說:“是的,目前懂機(jī)器學(xué)習(xí)又懂分布式系統(tǒng)的人才太少了(他還用了個詞 paucity,挺高大上的),你正好合適。”

他還把我介紹給 Peter Abbeel,幫我制定了一些學(xué)習(xí)計(jì)劃。我大概每個月都和 Greg 聯(lián)系一下。幾個月后,他說:“我們有個項(xiàng)目,需要做一個 StarCraft 環(huán)境。”于是我就加入幫忙搭建 StarCraft 環(huán)境。基本上我在 OpenAI 的前九個月都沒有做機(jī)器學(xué)習(xí)的工作。

主持人Harj Taggar

那當(dāng)時的 OpenAI 是什么樣的?拿到融資了嗎?有辦公室嗎?感覺更像是創(chuàng)業(yè)公司嗎?

聯(lián)創(chuàng)Tom Brown

所以當(dāng)時是在 Dandelion Chocolate 工廠樓上的辦公室。那是在 Greg 公寓之后。

主持人Diana Hu

對,Greg 公寓之后。

聯(lián)創(chuàng)Tom Brown

對,就在 Greg 公寓之后,搬到巧克力工廠那邊。那時 OpenAI 啟動,Elon 已經(jīng)承諾了 10 億美元的資金,感覺非常穩(wěn)。

3.參與訓(xùn)練 GPT-3狂堆算力,全力押中Scaling Law

主持人Diana Hu

對你來說,另一個重要的里程碑是參與構(gòu)建 GPT 的訓(xùn)練工程。

聯(lián)創(chuàng)Tom Brown

是的。

主持人Diana Hu

能具體說說嗎?GPT-2 的突破點(diǎn)是用 GPU 訓(xùn)練,而 GPT-3 的關(guān)鍵是“用更多算力+GPU 擴(kuò)展規(guī)?!?。

聯(lián)創(chuàng)Tom Brown

沒錯。我在 OpenAI 干了一年后離開,去 Google Brain 干了一年,再回到 OpenAI。2018 到 2019 年,就是 GPT-3 的醞釀期,正如你說的,核心就是擴(kuò)大規(guī)模。我記得 Dario 當(dāng)時已經(jīng)看到了“Scaling Law(規(guī)模定律)”的大趨勢。

主持人Diana Hu

你們還發(fā)表了那篇論文,對吧?那篇論文后來被證明非常有分量。

聯(lián)創(chuàng)Tom Brown

是的。當(dāng)時最打動我的,就是這條直線:只要用對配方,花更多算力,就能得到更強(qiáng)的智能。那讓我覺得:這不是未來的事,而是正在發(fā)生的事。即便那時我們花的錢并不算多,但趨勢已經(jīng)很清楚了。同時,Jared Kaplan 和 Sam McCandlish 的論文也顯示,算法效率的提升會讓成本不斷下降。這兩方面疊加,我當(dāng)時的想法就是:未來幾年智能會大幅提升。

主持人Garry Tan

當(dāng)時看到這一點(diǎn),確實(shí)很驚訝吧。

聯(lián)創(chuàng)Tom Brown

對。我不是物理學(xué)家,但當(dāng)時那些物理學(xué)家做出的那條“直線”,橫跨 12 個數(shù)量級。我從沒見過任何現(xiàn)象能跨 12 個數(shù)量級還這么穩(wěn)定。這讓我徹底相信必須把工作重心轉(zhuǎn)向 Scaling。

主持人Garry Tan

我問個外行問題:這種“規(guī)模定律”,是不是可能在很多領(lǐng)域都會出現(xiàn)?比如還有 2 個、5 個、1 萬個領(lǐng)域,我們只是還沒投入?

聯(lián)創(chuàng)Tom Brown

在物理學(xué)里,規(guī)模定律到處都是。當(dāng)時我并不知道,但后來才知道,物理學(xué)有個叫“現(xiàn)象學(xué)(Phenomenology)”的領(lǐng)域,就是在不同場景里擬合這些規(guī)律,他們發(fā)現(xiàn)冪律分布無處不在。而這大概是我第一次在計(jì)算機(jī)科學(xué)相關(guān)的研究里看到類似的規(guī)律,所以讓我既驚訝又興奮。

主持人Garry Tan

當(dāng)時也有人很反對,覺得就是在浪費(fèi)錢,往 GPU 里砸錢。

聯(lián)創(chuàng)Tom Brown

對,當(dāng)時很多研究人員也不滿,覺得不夠優(yōu)雅,只是“蠻力疊層數(shù)”。但我覺得這反而就是 Anthropic 的口號:去做那個笨但有效的事(do the stupid thing that works)。而 Scaling 當(dāng)時就是這樣一個“笨但有效”的方案。

4.直到 Claude 3.5上線,才意識到公司做成了

主持人Diana Hu

那你怎么收集最后一顆“無限寶石”的?就是加入 Anthropic。

聯(lián)創(chuàng)Tom Brown

對,Anthropic。

主持人Diana Hu

全世界其實(shí)沒幾個人在 OpenAI、DeepMind 和 Anthropic 都工作過。你們是 GPT-3 團(tuán)隊(duì)分裂出來的一部分,最后創(chuàng)辦了 Anthropic。這個轉(zhuǎn)折是怎么發(fā)生的?

聯(lián)創(chuàng)Tom Brown

當(dāng)時有兩個團(tuán)隊(duì),分別是安全組(safety org)和規(guī)模組(scaling org),都向 Dario 和 Daniela 匯報(bào)。

我們彼此的合作非常默契。當(dāng)時在 OpenAI 和后來 Anthropic,有一點(diǎn)我特別喜歡:我們要求一切溝通都在 Slack 上,公開頻道,透明溝通。而且這個團(tuán)隊(duì)是最認(rèn)真對待 Scaling Law 的人。他們意識到這將是“變革性的 AI”,未來人類遲早要把控制權(quán)交給這種系統(tǒng)。最好是它能和人類對齊,過渡順利,但也可能不順利,風(fēng)險(xiǎn)極大。所以我們覺得必須嚴(yán)肅對待,要建立一個能承擔(dān)這種責(zé)任的機(jī)構(gòu)。

最后正是這批人成為了 Anthropic 的核心。坦白說,當(dāng)時我并不確定這是對世界最正確的選擇。但現(xiàn)在回頭看,這確實(shí)是個好決定。有趣的是,剛起步時我們一點(diǎn)也不像會成功。OpenAI 有 10 億美元和明星團(tuán)隊(duì),而我們只有 7 個聯(lián)合創(chuàng)始人,在疫情期間硬撐著做事,不知道產(chǎn)品能不能做出來。但吸引我的一點(diǎn)是,最初加入的人全都是奔著使命來的。他們本可以去更有名、更賺錢的地方。

主持人Harj Taggar

保持開放?

聯(lián)創(chuàng)Tom Brown

沒錯,正是這種使命感,成為我們文化的核心。如今 Anthropic 已經(jīng)有 2000 人了,但依然沒被政治內(nèi)耗侵蝕。我認(rèn)為關(guān)鍵就在于,前 100 個人都是為了使命而來。如果有什么偏離使命的跡象,他們會第一時間站出來提醒。

主持人Jared Friedman

說回 Anthropic 的早期吧。你們七個人從 OpenAI 出走,大概有一個長期使命,就是“不要?dú)缛祟悺?。但在最初那一年里,你們?shí)際上在做什么?又是怎么收斂到一個真正的產(chǎn)品的?

聯(lián)創(chuàng)Tom Brown

第一年我主要做的兩件事:一是搭建訓(xùn)練所需的基礎(chǔ)設(shè)施,二是搞到訓(xùn)練模型所需的算力。這是我兩個核心項(xiàng)目。當(dāng)然,還有創(chuàng)業(yè)公司初期那些雜事,比如設(shè) Brex 賬戶之類的。我們最初只有 7 個聯(lián)合創(chuàng)始人,但幾個月內(nèi)大概有 25 個來自 OpenAI 的人陸續(xù)加入,所以很快就成了一支已經(jīng)熟悉彼此合作的隊(duì)伍,這讓我們能更快跑起來。

主持人Jared Friedman

那你們是什么時候真正發(fā)布第一個產(chǎn)品?什么時候開始覺得事情在運(yùn)轉(zhuǎn)了?

聯(lián)創(chuàng)Tom Brown

我們第一個產(chǎn)品其實(shí)是在 ChatGPT 之后。大概在 ChatGPT 發(fā)布前 9 個月,我們做了一個 Slack 版的 Claude 1。

主持人Garry Tan

對對,我記得在 YC 的 Slack 里就用過。

聯(lián)創(chuàng)Tom Brown

對,我記得 Tom Blofield 把你們都加進(jìn)去了。不過當(dāng)時我們并不確定要不要把它真正當(dāng)作產(chǎn)品發(fā)布,我們不確定這樣做對世界是否是好事。那時我們對“如何產(chǎn)生正向影響”的理論還沒想清楚。再加上,即使想發(fā)布,我們也沒有相應(yīng)的服務(wù)基礎(chǔ)設(shè)施。因?yàn)槟貌粶?zhǔn),我們遲遲沒去搭建那部分基礎(chǔ)設(shè)施,這對我來說是一個教訓(xùn)。

主持人Garry Tan

當(dāng)時 ChatGPT 還沒上線。

聯(lián)創(chuàng)Tom Brown

對,還沒上線,所以我們也不知道它會掀起這么大的浪潮。

主持人Diana Hu

那是疫情期間,大概 2022 年?

聯(lián)創(chuàng)Tom Brown

對,2022 年夏天。然后 ChatGPT 在 2022 年秋天上線,我們之后才發(fā)布 API,后來才有 Claude AI。其實(shí)直到 Claude 3.5 和編程能力出來之前,一直都不太確定我們會不會是一家真正能成功的公司。

主持人Diana Hu

我們其實(shí)在 YC 創(chuàng)業(yè)公司里看得很清楚。2023 年,幾乎所有創(chuàng)業(yè)公司默認(rèn)用的都是 OpenAI。但到了 2024 年情況開始轉(zhuǎn)變,Claude 3.5,尤其是 Sonnet,逐漸獲得市場份額,從個位數(shù)到 20%、30%。尤其在編程領(lǐng)域,Claude 成了默認(rèn)選擇,這點(diǎn)非常有趣。你能說說為什么在編程上會出現(xiàn)這種突出的表現(xiàn)嗎?

主持人Garry Tan

現(xiàn)在可能已經(jīng)是 80%、甚至 90% 了,編程領(lǐng)域甚至更高。

5.不搞刷榜:“我們完全忽略這些外部基準(zhǔn)測試”

主持人Diana Hu

特別是 Claude Code。當(dāng)時這是你們刻意布局的嗎,還是自然發(fā)生的?

聯(lián)創(chuàng)Tom Brown

我們確實(shí)在訓(xùn)練里投入更多,讓模型在編程上表現(xiàn)更好。一開始只是想讓模型在編程上能用。但看到外界的反響后,我們決定更大力地投入。

主持人Jared Friedman

所以在 3.5 Sonnet 之前,你們其實(shí)就已經(jīng)押注了編程,等 3.5 出來有了明顯的產(chǎn)品市場契合度,就進(jìn)一步加碼。

聯(lián)創(chuàng)Tom Brown

對,這其實(shí)源于公司內(nèi)部一些人很早就堅(jiān)持要做編程能力。等到 3.5 Sonnet 出來后,我們終于看到了強(qiáng)烈的市場信號,于是更堅(jiān)定了方向。

主持人Jared Friedman

那你們發(fā)布 3.5 Sonnet 的那一天,是否知道自己抓到了一個“關(guān)鍵轉(zhuǎn)折點(diǎn)”?還是像 OpenAI 推出 ChatGPT 那樣,也有點(diǎn)被它意外的爆發(fā)力嚇到了?

聯(lián)創(chuàng)Tom Brown

老實(shí)說,我們也沒預(yù)料到。真希望當(dāng)時能更有遠(yuǎn)見。但它的確讓我們很意外。之后 3.7 Sonnet 在“代理+編程”上的表現(xiàn)也再次讓我們吃驚。很多東西我們都是快速推出,往往不知道最終結(jié)果會怎樣。

主持人Diana Hu

這其實(shí)也催生了很多基于 Sonnet 的編程代理創(chuàng)業(yè)公司。比如 Replica,10 個月就做到 1 億美元規(guī)模;還有 Cursor 之類的案例。

聯(lián)創(chuàng)Tom Brown

是的,這些都讓我很意外。而且我自己在用 Claude 的時候,也常常被它的能力驚到。幾乎每次新版本都會解鎖出一些新能力。

比如有個朋友手上只有某個工具的編譯二進(jìn)制,沒有源碼。她問 Claude 能不能反編譯。Claude 運(yùn)算了 10 分鐘,就生成了一個 C 語言版本,變量名都補(bǔ)上了。她說,自己要花三天時間才能手動對著十六進(jìn)制表一點(diǎn)點(diǎn)寫代碼,而 Claude 一次性完成了。

所以我覺得我們還會不斷被它的能力驚訝到。Claude 已經(jīng)把所有十六進(jìn)制表背下來了,還能嘗試去推理,所以未來肯定還會出現(xiàn)更多讓人意想不到的場景。

主持人Jared Friedman  

如果你去問 YC 的創(chuàng)業(yè)者們,絕大多數(shù)在編程方面更喜歡用 Anthropic 的模型。這個差距遠(yuǎn)遠(yuǎn)超出單看基準(zhǔn)測試結(jié)果能預(yù)測的程度。

聯(lián)創(chuàng)Tom Brown

是的。

主持人Jared Friedman

似乎有某種“X 因素”,讓大家特別喜歡用 Claude 來寫代碼。你知道那是什么嗎?是你們有意設(shè)計(jì)的,還是模型自己在黑箱里意外長出來的?

聯(lián)創(chuàng)Tom Brown

我覺得主要原因在于基準(zhǔn)測試(benchmarks)?;鶞?zhǔn)測試很容易“刷分”。其他大實(shí)驗(yàn)室都有專門的團(tuán)隊(duì),工作就是讓模型在基準(zhǔn)測試上拿高分。但我們沒有這樣的團(tuán)隊(duì)。我覺得這可能是最大的差別。

主持人Garry Tan

不“為考試而教”。

聯(lián)創(chuàng)Tom Brown

對,我們不專門去訓(xùn)練模型刷榜。我覺得那樣會帶來很糟糕的激勵機(jī)制。你甚至可以把這種“刷榜團(tuán)隊(duì)”放到市場部下面,但我們選擇完全忽略這些外部基準(zhǔn)測試。這也是為什么會出現(xiàn)“訓(xùn)練/測試不匹配”。

主持人Diana Hu

所以你們的評估更偏向內(nèi)部的定性?

聯(lián)創(chuàng)Tom Brown

我們有內(nèi)部基準(zhǔn)測試,但不會對外發(fā)布。

主持人Jared Friedman

那團(tuán)隊(duì)重點(diǎn)提升的,確實(shí)是這些內(nèi)部基準(zhǔn)?

聯(lián)創(chuàng)Tom Brown

沒錯。我們團(tuán)隊(duì)會針對內(nèi)部基準(zhǔn)持續(xù)改進(jìn)。同時還有很多實(shí)用任務(wù),比如讓我們自己的工程師提效,這是頭等大事。所以我們內(nèi)部會大量“自用測試”(dogfooding),確保模型真的幫到我們的人。

主持人Garry Tan 

再說回 Golden Gate Claude,大家普遍覺得 Claude 的可解釋性做得不錯,還有就是它的人格特質(zhì)讓人感覺更好。你們怎么同時做到量化評估,又能打造出這種“人格”?

聯(lián)創(chuàng)Tom Brown  

評估“人格”確實(shí)比較難,比如怎么判斷 Claude 是否“有一顆善良的心”。但這正是 Amanda Askell 團(tuán)隊(duì)的使命。她的描述是:Claude 要像一個“優(yōu)秀的世界旅行者”,能和各種背景的人交流,每個人在對話后都覺得舒服、愉快。至于可解釋性,那是一個長期下注?,F(xiàn)在模型還不可怕,但未來會變得更強(qiáng)、更“嚇人”,那時就必須能看懂它內(nèi)部到底在做什么。

6.Claude Code 從內(nèi)部走出去:“模型中心化”是成功關(guān)鍵

主持人Harj Taggar

最近 Claude Code 特別成功。能說說這個項(xiàng)目最初是怎么開始的嗎?你們一開始就覺得它會成功嗎?

聯(lián)創(chuàng)Tom Brown

Claude Code 起初是 Anthropic 內(nèi)部工具,目的是幫我們自己的工程師。最早是 Boris 拼湊出來的。

主持人Harj Taggar

所以是內(nèi)部工程師自發(fā)做的?

聯(lián)創(chuàng)Tom Brown

對,他為自己和其他工程師寫的。我們當(dāng)時完全沒預(yù)料到它能在外部市場也成功。其實(shí)那時我們內(nèi)部的策略是:押注 API,而不是自己做應(yīng)用。因?yàn)槲覀冇X得外面有那么多創(chuàng)業(yè)者,有更好的點(diǎn)子,比我們更懂怎么做產(chǎn)品,所以我們專注于把 API 打磨到最好。但 Claude Code 出乎意料,證明我們也能做出比外部產(chǎn)品更好的東西。我的一個看法是,這部分成功來自于心態(tài)轉(zhuǎn)變:我們把 Claude 本身當(dāng)成用戶去設(shè)計(jì)工具,就像 Grouper 時我們的“用戶”是紐約的年輕單身群體?,F(xiàn)在的用戶是開發(fā)者,但也是 Claude 本身。給 Claude 提供合適的工具和上下文,它才能真正高效工作。這個團(tuán)隊(duì)是最重視 Claude 作為“用戶”的團(tuán)隊(duì)。

主持人Jared Friedman

所以你們比任何人都更懂 Claude。

聯(lián)創(chuàng)Tom Brown

是的。但我也覺得,創(chuàng)業(yè)者同樣能做到這一點(diǎn)。這是一個很值得挖掘的方向:以模型作為“用戶”去開發(fā)工具。

主持人Garry Tan

這正是最典型的擬人化:把 LLM 本身視為一個利益相關(guān)方、一個用戶,你需要去服務(wù)和賦能它。

聯(lián)創(chuàng)Tom Brown

完全正確。

主持人Diana Hu

這也解釋了為什么你們的 MCP(工具調(diào)用標(biāo)準(zhǔn))能跑通。很多實(shí)驗(yàn)室嘗試過,但最后真正跑通并被廣泛采用的,是你們的。

聯(lián)創(chuàng)Tom Brown

對,這和 Claude Code 的邏輯類似,都是“模型中心化”的思路。

主持人Harj Taggar

但 Claude Code 的成功,也讓依賴 API 的創(chuàng)業(yè)公司有些擔(dān)心,比如 Cursor。他們可能害怕被你們替代。你會給這類創(chuàng)業(yè)者什么建議?怎么在 API 之上建產(chǎn)品,同時不用過分擔(dān)心 Anthropic 會做得更好?

聯(lián)創(chuàng)Tom Brown

老實(shí)說,我也有點(diǎn)意外 Claude Code 能做到“市場最好”。對我來說,最大的優(yōu)勢可能不是技術(shù)壁壘,而是我們對 Claude 更有“共情”,更懂它需要什么。

主持人Harj Taggar

這挺有意思。也就是說,你們成功的關(guān)鍵在于:你們更清楚自己要服務(wù)的“用戶”,而不是有什么別人做不到的技術(shù)優(yōu)勢。

聯(lián)創(chuàng)Tom Brown

對,這件事創(chuàng)業(yè)公司同樣能做。我覺得我們是最專注開發(fā)者的實(shí)驗(yàn)室,也是最專注 API 的實(shí)驗(yàn)室。我們想確保提供最好的平臺,因?yàn)檫@個領(lǐng)域發(fā)展太快了,我們不可能最快想清楚所有應(yīng)用場景。但人類社會是為人類設(shè)計(jì)的,我們需要讓模型也能成為生產(chǎn)力的一部分。

主持人Harj Taggar

那你覺得目前有哪些方向是開發(fā)者可以去嘗試,但還被低估的?

聯(lián)創(chuàng)Tom Brown

Claude Code 其實(shí)就是在探索:如何讓 Claude 成為一個合格的“結(jié)對編程伙伴”或“初級工程師”。它很像一個二三年級水平的工程師:能幫忙,但也需要大量上下文和引導(dǎo)。而在商業(yè)社會里,編程只是所有任務(wù)中的一小部分。還有很多工作,是聰明但經(jīng)驗(yàn)不足的人會去做的。如何去“教練”Claude 或其他模型,讓它們能為企業(yè)完成有用的任務(wù),這里面有巨大的空間。

7.算力基礎(chǔ)超阿波羅登月,每年還在漲3倍

主持人Jared Friedman

Tom,你的工作中很大一部分就是負(fù)責(zé) Anthropic 的算力基礎(chǔ)設(shè)施。能談?wù)勚芜@家龐大公司的算力基礎(chǔ)設(shè)施長什么樣嗎?

聯(lián)創(chuàng)Tom Brown

有趣的是,現(xiàn)在人類正處在史上最大規(guī)模的基礎(chǔ)設(shè)施建設(shè)進(jìn)程中。

主持人Jared Friedman

會比阿波羅登月計(jì)劃、曼哈頓計(jì)劃還要大?

聯(lián)創(chuàng)Tom Brown

如果照現(xiàn)在的趨勢繼續(xù)下去,明年就會超過這兩者。算力投入基本上是每年增長 3 倍,這太瘋狂了。3 倍的年增速不可思議。我認(rèn)為這種趨勢會保持下去。至少明年的投入已經(jīng)確定了,2027 年可能還有些不確定。

主持人Garry Tan

我們在 YC 這邊也能感受到,所有頂尖前沿模型(包括 Claude)的算力點(diǎn)數(shù)都供不應(yīng)求。大家都在喊:“給我更多智能!”

聯(lián)創(chuàng)Tom Brown

對,怎么都不夠。我知道你們也在關(guān)注更多硬件創(chuàng)業(yè)公司,特別是新的加速器。我覺得到 2027 年會有更多加速器上線。這是個不錯的方向。同時,數(shù)據(jù)中心本身也是大問題。

主持人Jared Friedman

你們現(xiàn)在的瓶頸主要是什么?是電力不足?GPU 不夠?還是建造許可難批?

聯(lián)創(chuàng)Tom Brown

整體而言,電力會是最大瓶頸,尤其是在美國。我們希望在美國建數(shù)據(jù)中心,這是最重要的政策目標(biāo)之一——讓美國建設(shè)更多數(shù)據(jù)中心、放寬審批、簡化流程。

主持人Garry Tan

那解決方案是可再生能源,還是核電?

聯(lián)創(chuàng)Tom Brown

我覺得都需要。我希望核電建設(shè)能更容易一些。

主持人Jared Friedman

Anthropic 還是唯一一家同時使用三家不同廠商 GPU 的主要實(shí)驗(yàn)室。說說你們這個策略的效果?

聯(lián)創(chuàng)Tom Brown

是的,我們用不同廠商的 GPU 和加速卡。壞處是我們的性能工程團(tuán)隊(duì)必須分散在這些平臺上,工作量巨大。好處是靈活性:一方面,我們能吸收更多供給,不依賴單一廠商;另一方面,不同芯片更適合不同任務(wù)——有的更適合推理,有的更適合訓(xùn)練。我們能把合適的芯片匹配給合適的任務(wù)。這就是取舍所在。

主持人Diana Hu

有趣的是,把你職業(yè)生涯串起來看,你當(dāng)年是第一個在 OpenAI 把架構(gòu)從 TPU 轉(zhuǎn)向 GPU 的工程師,這讓 GPT-3 能規(guī)?;?。如今你在 Anthropic 負(fù)責(zé)更大規(guī)模的算力布局。你自己會覺得這是種呼應(yīng)嗎?

聯(lián)創(chuàng)Tom Brown

當(dāng)時在 OpenAI 轉(zhuǎn)向 GPU,部分原因是 PyTorch 在 GPU 上的開發(fā)體驗(yàn)遠(yuǎn)好于 TensorFlow 在 TPU 上的體驗(yàn)。這帶來了快速迭代。好的軟件棧能讓實(shí)驗(yàn)加速,系統(tǒng)整體跑得更好?,F(xiàn)在在 Anthropic,我們依然很重視這點(diǎn)。挑戰(zhàn)在于平臺更多,寫好底層軟件更難。但能不能構(gòu)建出可靠的軟件棧,決定了上層所有人是否能順暢開發(fā),這是最重要的。

主持人Diana Hu

那你有沒有什么建議,給如今 20 多歲、正想加入 AI 浪潮的“年輕版 Tom”?

主持人Harj Taggar

對,很多大學(xué)生在糾結(jié):要不要繼續(xù)讀書?未來還有沒有工作?世界會怎么變?他們該怎么選擇?

聯(lián)創(chuàng)Tom Brown

我會建議,多冒點(diǎn)險(xiǎn)。去做那些如果成功了,朋友會覺得特別厲害、你自己也會為之驕傲的事。這是我想對年輕的自己說的。

主持人Garry Tan

更看重內(nèi)在動機(jī),而不是外在榮譽(yù)。別去追逐那些學(xué)歷、證書、進(jìn) FANG 的頭銜,這些在今天其實(shí)都不那么重要。——好的,這就是今天的全部內(nèi)容,下次再見。

視頻地址:https://www.youtube.com/watch?v=JdT78t1Offo

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2025-08-21 09:07:00

2019-07-21 21:56:38

代碼開發(fā)工具

2019-07-19 19:47:44

代碼開發(fā)GitHub

2024-05-06 08:45:00

Meta訓(xùn)練

2019-07-20 22:46:48

2022-06-23 06:43:55

異常數(shù)據(jù)上報(bào)異常監(jiān)控sdk阿波羅移動端

2023-10-11 10:13:45

自動駕駛軌跡

2011-05-31 16:45:30

Windows Pho微軟

2023-11-27 13:35:36

谷歌AI

2012-05-03 09:10:39

Windows Pho

2021-12-29 15:05:33

筆記本電腦大型機(jī)計(jì)算機(jī)

2014-04-08 11:47:36

NASA軟件開源

2019-08-09 11:10:39

程序員技能開發(fā)者

2012-06-21 09:49:19

Windows Pho諾基亞

2024-03-08 13:18:44

模型訓(xùn)練

2025-08-18 09:16:00

2025-10-03 12:20:41

2012-06-12 14:05:22

2025-08-05 15:12:28

ClaudeAnthropicAPI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號