偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

差點(diǎn)被Ilya摁掉,胎死腹中!ChatGPT爆紅內(nèi)幕首次公開

人工智能
從「與GPT-3.5暢聊」到「ChatGPT」,OpenAI團(tuán)隊(duì)如何在混亂中拍板上線、又怎樣被用戶「點(diǎn)贊」調(diào)教成「賽博舔狗」?從產(chǎn)品發(fā)布、命名內(nèi)幕、團(tuán)隊(duì)文化到AI時(shí)代核心競(jìng)爭(zhēng)力,深度訪談揭開幕后全過程!

自2022年11月30日上線以來,ChatGPT迅速爆紅。

連OpenAI自己都沒料到會(huì)這么火。

在OpenAI播客第二期中,ChatGPT負(fù)責(zé)人Nick Turley和首席研究官M(fèi)ark Chen首度揭秘這款產(chǎn)品的幕后故事。

從名字的由來,到病毒式傳播的意外驚喜;

從內(nèi)部激烈的發(fā)布爭(zhēng)論,到模型行為如何調(diào)整,他們逐一詳解。

圖片圖片

他們還討論了圖像生成技術(shù)的突破、編程方式的變革以及OpenAI的企業(yè)文化等。

這場(chǎng)對(duì)話不僅揭示了ChatGPT成功的原因,也展望了AI在醫(yī)療、研究等領(lǐng)域的未來機(jī)遇。

??本來只是預(yù)覽,沒想到火了!

OpenAI起名爛得出名,在ChatGPT發(fā)布前,這款日后爆火、載入史冊(cè)的產(chǎn)品叫「與GPT 3.5暢聊」(Chat with GPT 3.5)。

至于GPT到底是啥意思?

在當(dāng)時(shí),OpenAI內(nèi)部眾說紛紜。一半的人認(rèn)為是「生成式預(yù)訓(xùn)練」(generative pre-training),另一半人認(rèn)為它是「生成式預(yù)訓(xùn)練Transformer」(generative pre-trained transformer)。

事實(shí)上,GPT是后者「generative pre-trained transformer」的縮寫。

OpenAI是如何決定ChatGPT這個(gè)酷炫的名字的?

某天,他們意識(shí)到「Chat with GPT 3.5」這個(gè)稱呼有些拗口,難以發(fā)音。

于是,在發(fā)布前的某個(gè)深夜,他們決定簡(jiǎn)化一下。

具體的改名時(shí)間,難以回憶了:在發(fā)布前的前一天晚上,也可能是發(fā)布當(dāng)天。

那時(shí)候,各種情況已經(jīng)很混亂了,一團(tuán)亂麻。

當(dāng)時(shí)GPT 3.5模型已經(jīng)發(fā)布好幾個(gè)月了,ChatGPT只是一個(gè)低調(diào)的研究預(yù)覽。

研究預(yù)覽意味著不保證穩(wěn)定性,系統(tǒng)可能會(huì)宕機(jī)。

因?yàn)閺哪芰嵌葋砜?,?dāng)只看看評(píng)估結(jié)果時(shí),你會(huì)覺得「哦,還是老一套,只是加了一個(gè)界面,減少了提示需求,然后聊天功能就出來了」。

圖片圖片

發(fā)布時(shí),OpenAI的博客稱:「ChatGPT是InstructGPT的姊妹模型——后者經(jīng)專門訓(xùn)練,能夠精準(zhǔn)遵循用戶指令并生成詳盡的回應(yīng)?!?/p>

日后ChatGPT的火爆,在他們的意料之外。

那么,ChatGPT 是什么時(shí)候開始爆火的呢?

毫無疑問,每個(gè)人都有自己的記憶,因?yàn)槟嵌螘r(shí)期非?;靵y。

對(duì)ChatGPT負(fù)責(zé)人Nick Turley來說,直到發(fā)布后第四天,他才意識(shí)到ChatGPT就是「AI界的iPhone」,它將改變世界。

圖片圖片

第一天,數(shù)據(jù)暴漲,他還在想:「儀表盤是不是壞了?日志數(shù)據(jù)肯定不對(duì)?!?/p>

第二天,他心想:「哦,奇怪,日本Reddit網(wǎng)友發(fā)現(xiàn)了這個(gè)東西,也許這只是小范圍的現(xiàn)象?!?/p>

第三天,他意識(shí)到:「好吧,它確實(shí)火起來了,但熱度很快就會(huì)消失?!?/p>

到了第四天,他才明白:「它將改變世界?!?/p>

不過,對(duì)于當(dāng)時(shí)的前沿研究負(fù)責(zé)人Mark Chen而言,第一天就是意識(shí)到ChatGPT不一樣:它的增長速度非??臁?/p>

圖片圖片

他認(rèn)為這是通向通用人工智能(AGI)夢(mèng)想的里程碑,OpenAI將成為谷歌這樣耳熟能詳?shù)拇笃放啤?/p>

但ChatGPT,真的只是一個(gè)很隨意的名字。

只答對(duì)了一半問題,它值得發(fā)布嗎?

那OpenAI內(nèi)部對(duì)ChatGPT是否真的「有用」、是否應(yīng)該發(fā)布,其實(shí)意見也不一致。

Mark回憶稱:「并不是所有人都同意發(fā)布?!?/p>

甚至在上線前一天晚上,聯(lián)合創(chuàng)始人Ilya對(duì)模型提了十個(gè)問題,難度都非常大。其中只有五個(gè)回答, 他認(rèn)為還算「可以接受」。

圖片圖片

這成了OpenAI內(nèi)部的「經(jīng)典傳說」。

所以,當(dāng)時(shí)他們面臨一個(gè)「艱難的抉擇」:「到底要不要上線這個(gè)模型?外界會(huì)怎么看它?它到底夠不夠好?」

這也反映出類似「知識(shí)詛咒」的現(xiàn)象——

當(dāng)在內(nèi)部開發(fā)這些模型時(shí),你很快就會(huì)對(duì)它的能力習(xí)以為常。

你很難再設(shè)身處地地站在一個(gè)沒有參與模型訓(xùn)練過程的人的角度,去感受那種真正的魔力。

對(duì)此,Nick也非常贊同。這也是一個(gè)提醒:在AI上,其實(shí)OpenAI經(jīng)常判斷錯(cuò)誤:

你以為它還不夠好,但現(xiàn)實(shí)卻是用戶覺得非常有用。

這就是為什么與現(xiàn)實(shí)頻繁接觸如此重要。

因?yàn)闆]有哪個(gè)明確的時(shí)間點(diǎn),你能斷定:「現(xiàn)在模型終于有用了。」

「有用」是連續(xù)的光譜,并沒有一條清晰的界線。

你可能還在猶豫它是否達(dá)到那個(gè)「理想點(diǎn)」,但現(xiàn)實(shí)的用戶已經(jīng)從中受益了。

只有真正讓模型接觸用戶,才能理解它的實(shí)際價(jià)值。這就是「與現(xiàn)實(shí)頻繁接觸」的核心含義。

在ChatGPT項(xiàng)目上,開發(fā)團(tuán)隊(duì)非常有原則,就是不讓項(xiàng)目范圍無限制地膨脹。他們堅(jiān)決要求盡快獲得反饋和數(shù)據(jù)。

這與傳統(tǒng)科技巨頭的發(fā)布慣例不同。

在假期來臨之前,傳統(tǒng)巨頭會(huì)發(fā)布一些新東西。比如說如果在11月某個(gè)時(shí)間點(diǎn)之后,某個(gè)項(xiàng)目還沒有上線,那它就得等到來年2月了。好像總有那么一個(gè)發(fā)布窗口期。

而OpenAI要靈活得多,這也是ChatGPT首次發(fā)布留下的影響:一旦人們開始使用ChatGPT,改進(jìn)速度就變得非常驚人。

OpenAI當(dāng)然可以考慮用更多數(shù)據(jù)、在更大的規(guī)模上訓(xùn)練,擴(kuò)大計(jì)算資源,但真實(shí)用戶使用所帶來的信號(hào),是完全不同的概念。

隨著時(shí)間的推移,反饋已經(jīng)真正成為OpenAI構(gòu)建產(chǎn)品不可或缺的一部分。它也成了OpenAI安全工作的一部分。

大家總能感覺到,因?yàn)楠q豫而錯(cuò)失反饋所帶來的時(shí)間成本。

當(dāng)然,可以閉門造車地反復(fù)思量:用戶會(huì)更喜歡這個(gè),還是更喜歡那個(gè)?

但這完全無法替代把它直接推向市場(chǎng)的檢驗(yàn)。

最初發(fā)布AI模型的方式,更像是發(fā)布硬件:很少發(fā)布,每次發(fā)布都必須盡善盡美,發(fā)布后就不再更新,然后轉(zhuǎn)頭去做下一個(gè)大項(xiàng)目。它資本密集,周期漫長。

但隨著時(shí)間的推移,ChatGPT帶來了轉(zhuǎn)折點(diǎn)。現(xiàn)在,OpenAI的理念就是讓模型與真實(shí)世界接觸。他們轉(zhuǎn)向了更像軟件的發(fā)布方式:頻繁更新,快速試錯(cuò),靈活回滾,降低單次發(fā)布的風(fēng)險(xiǎn)。

現(xiàn)在,這也成了OpenAI提升模型性能最重要的杠桿之一。

警鐘ChatGPT一夜變「舔狗」

頻繁更新、高度依賴用戶反饋來改進(jìn)模型,可以更貼近用戶需求,可以更快地創(chuàng)新。但也有問題。

一個(gè)典型例子就是模型變得過于諂媚和阿諛奉承。人們突然發(fā)現(xiàn)ChatGPT會(huì)說:「嘿,您的智商高達(dá)190,您是智慧巨人,您還是宇宙中最帥的人?!?/p>

Mark認(rèn)為:「這是個(gè)典型例子,說明我們高度依賴用戶反饋來改進(jìn)模型。」他解釋了具體的技術(shù)原因。

它背后涉及到「人類反饋強(qiáng)化學(xué)習(xí)」(RLHF)。比如,當(dāng)用戶喜歡某個(gè)回答時(shí),會(huì)點(diǎn)「贊」。

OpenAI訓(xùn)練模型,傾向于生成更多能獲得點(diǎn)贊的回答。

聽起來很合理,但一旦平衡不好,模型就可能變得過于討好。用戶可能會(huì)偏愛被贊美的感覺,模型就開始學(xué)會(huì)「拍馬屁」,變成「賽博舔狗」。

但其實(shí)這種現(xiàn)象只是少數(shù)高級(jí)用戶發(fā)現(xiàn)的,而大多數(shù)普通用戶并沒察覺到。

這是依賴用戶反饋?zhàn)畹湫偷呢?fù)面例子。

問題被發(fā)現(xiàn)后不久,Joanne Jang就發(fā)文回應(yīng),詳細(xì)解釋了來龍去脈。

圖片圖片

「諂媚事件」非常重要,是很好的教訓(xùn)。但從根本上說,Mark Chen認(rèn)為OpenAI有正確的機(jī)制來打造出色的產(chǎn)品。

OpenAI更看重這些能力

而不是PhD文憑

奇點(diǎn)已至,未來人們需要什么樣的技能?

這是現(xiàn)在很普遍的問題。

在自己的團(tuán)隊(duì)中,OpenAI尋找什么樣的技能?

Nick對(duì)此思考了很久。

圖片圖片

招聘很難,特別是如果想組建一支規(guī)模小、能力強(qiáng)、謙遜且能快速行動(dòng)的團(tuán)隊(duì)。他認(rèn)為,「好奇心」是最重要的特質(zhì)。

世界瞬息萬變,到底該怎么做?

對(duì)大家來說,有太多未知。在開發(fā)AI時(shí),你必須保持一定的謙遜,因?yàn)樵谀阏嬲パ芯?、去深入、去嘗試?yán)斫庵?,你并不知道什么是有價(jià)值的,什么是有風(fēng)險(xiǎn)的。

現(xiàn)在在工作的方方面面,我們顯然要與AI協(xié)作,不僅僅是編碼。而在這方面的瓶頸,在于提出正確的問題,而不一定是得到答案。

從根本上, 他相信:「我們需要雇傭那些對(duì)世界、對(duì)我們的事業(yè)抱有深度好奇心的人。我反而不太在乎他們是否有AI領(lǐng)域的經(jīng)驗(yàn)。」

就產(chǎn)品團(tuán)隊(duì)而言,Nick發(fā)現(xiàn):好奇心是成功的最佳預(yù)測(cè)指標(biāo)。

即使在研究團(tuán)隊(duì),OpenAI現(xiàn)在也越來越不看重你是否擁有AI博士學(xué)位了。

Mark Chen剛加入OpenAI時(shí),也沒有AI經(jīng)驗(yàn),而現(xiàn)在是首席研究官。

對(duì)新員工來說,Mark Chen認(rèn)為很重要的一點(diǎn)是「自主性」(agency)。在OpenAI,你不會(huì)得到事無巨細(xì)的指令。

OpenAI真正需要的是,你能主動(dòng)去發(fā)現(xiàn)問題,然后心想:「嘿,這有個(gè)問題,沒人解決,那我就自己上,把它搞定?!?/p>

此外, 他也看重「適應(yīng)性」。

AI日新月異,變化極快,這是AI領(lǐng)域目前的本質(zhì)。你需要能夠快速判斷什么是重要的,并迅速調(diào)整工作方向。

從根本上說,OpenAI擁有大量具備自主性、能夠「搞定事情」的人——產(chǎn)品發(fā)布還能更快。

這體現(xiàn)在產(chǎn)品、研究和政策等各個(gè)方面。當(dāng)然,「搞定事情」的含義各不相同。

這種高比例的實(shí)干家,以及除了在關(guān)鍵領(lǐng)域外極少的繁文縟節(jié),正是 OpenAI 的獨(dú)特之處。

當(dāng)從200人增長到2000人時(shí),很多事情可能會(huì)改變。在某些方面,OpenAI確實(shí)變了。但人們常常低估了OpenAI所做事情的多樣性。

在OpenAI工作,更像是身處一所大學(xué):因?yàn)橐粋€(gè)共同的理想,大家聚集在這里,但每個(gè)人都在做著不同的事情。在午餐或晚餐時(shí),你會(huì)坐下來和某人聊天,了解他們正在做的事,然后你會(huì)驚嘆:「哇,你做的那個(gè)東西太酷了!」

正因?yàn)镺penAI涉足的領(lǐng)域如此廣泛,每個(gè)具體的項(xiàng)目——無論是 ChatGPT、Sora還是其他——實(shí)際上都是由非常精簡(jiǎn)、保守的團(tuán)隊(duì)來負(fù)責(zé)。

比如,開發(fā)ChatGPT的團(tuán)隊(duì)總?cè)藬?shù)大約只有200。

這保證了團(tuán)隊(duì)成員高度的自主性,并確保他們擁有所需的資源。

參考資料:

https://www.youtube.com/watch?v=atXyXP3yYZ4


責(zé)任編輯:武曉燕 來源: 新智元
相關(guān)推薦

2025-05-16 10:17:54

2025-09-15 07:51:35

2025-01-20 15:22:55

2023-12-01 09:59:27

2024-03-07 12:30:30

2009-08-02 08:47:59

Windows 7EWindows 7歐洲

2025-04-01 09:23:00

2024-08-09 12:47:12

2023-05-14 22:25:33

內(nèi)存CPU

2023-03-27 07:39:07

內(nèi)存溢出優(yōu)化

2023-11-20 21:56:57

入職微軟

2023-12-12 17:53:27

馬斯克AIChatGPT

2025-03-06 09:00:00

模型AIChatGPT

2021-02-17 10:31:27

MySQL磁盤數(shù)據(jù)

2020-11-18 09:56:46

Java開發(fā)代碼

2020-08-07 07:54:08

代碼

2023-02-06 13:36:28

機(jī)器人OpenAIAI

2020-07-01 09:07:52

SQL索引語句

2022-12-08 09:34:26

開發(fā)操作
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)