偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

4o-mini華人領(lǐng)隊(duì)也離職了,這次不怪小扎

人工智能 新聞
在最近激烈的硅谷人才大戰(zhàn)中,Thinking Machine Lab獨(dú)善其身,十幾名成員無(wú)人接受小扎offer,10億美元薪酬都拒絕。

哦豁,OpenAI奧特曼又痛失一員大將。

Kevin Lu,領(lǐng)導(dǎo)4o-mini發(fā)布,并參與o1-mini、o3發(fā)布,主要研究強(qiáng)化學(xué)習(xí)、小模型和合成數(shù)據(jù)。

下一站是Thinking Machine Lab,OpenAI前CTO Mira Murati出走后新創(chuàng)立的AI公司,估值已達(dá)120億美元。

不完全統(tǒng)計(jì),Thinking Machine Lab已經(jīng)集結(jié)數(shù)位OpenAI前核心研究員,包括John Schulman、Barrett Zoph、翁荔等。

從Meta到OpenAI,再離開(kāi)

Kevin Lu畢業(yè)于UC伯克利,主要研究強(qiáng)化學(xué)習(xí)和離線序列數(shù)據(jù)建模。

畢業(yè)后先后加入Hudson River Trading和Meta,2024年3月加入OpenAI。

入職3個(gè)月后領(lǐng)導(dǎo)團(tuán)隊(duì)完成了4o-mini,這是一個(gè)多模態(tài)推理小模型。支持圖文輸入、長(zhǎng)上下文,適合復(fù)雜任務(wù);同時(shí)速度更快、成本更低。

此外還參與了o1-mini和o3的模型開(kāi)發(fā)。主要擅長(zhǎng)的領(lǐng)域應(yīng)該是小模型和強(qiáng)化學(xué)習(xí)。

其引用量最高的一篇論文是《決策Transformer:通過(guò)序列建模進(jìn)行強(qiáng)化學(xué)習(xí)》,引用量2254。

這篇論文發(fā)表于2021年,研究團(tuán)隊(duì)集結(jié)了UC伯克利、Meta AI、UCLA、OpenAI和Google Brain。

這是一個(gè)將強(qiáng)化學(xué)習(xí)問(wèn)題視為條件序列建模的架構(gòu),通過(guò)將自回歸模型基于期望回報(bào)(獎(jiǎng)勵(lì))、過(guò)去的狀態(tài)和動(dòng)作進(jìn)行條件化,決策Transformer能夠生成期望回報(bào)的未來(lái)動(dòng)作。

近期,Kevin Lu的一篇與他主要研究領(lǐng)域相關(guān)的博客還有點(diǎn)出圈:互聯(lián)網(wǎng)才是唯一重要的技術(shù)。

他認(rèn)為現(xiàn)在對(duì)Transformer架構(gòu)的關(guān)注有點(diǎn)過(guò)高了,真正重要的還是數(shù)據(jù)。研究者們應(yīng)該關(guān)注如何從互聯(lián)網(wǎng)這樣的數(shù)據(jù)源中學(xué)習(xí)和預(yù)測(cè),因?yàn)榛ヂ?lián)網(wǎng)提供了大量序列相關(guān)數(shù)據(jù),非常適合進(jìn)行“下一個(gè)token預(yù)測(cè)”。

在少量數(shù)據(jù)的環(huán)境里,Transformer將失去價(jià)值。

以及現(xiàn)在強(qiáng)化學(xué)習(xí)難以實(shí)現(xiàn)從GPT-1到GPT-4般的重大突破,應(yīng)該停止進(jìn)行強(qiáng)化學(xué)習(xí)研究,將注意力放在產(chǎn)品開(kāi)發(fā)上。

強(qiáng)化學(xué)習(xí)的未來(lái)可能涉及到新的數(shù)據(jù)源和獎(jiǎng)勵(lì)機(jī)制創(chuàng)新,這可能是AI研究的新方向。

剛剛完成20億美元種子輪融資

Kevin Lu的下一站Thinking Machine Lab,也是AI領(lǐng)域近期討論度最高的初創(chuàng)公司之一。

它由OpenAI前CTO Mira Murati聯(lián)合多位OpenAI前成員成立。

除了Mira本人外,團(tuán)隊(duì)核心成員已經(jīng)覆蓋AI領(lǐng)域目前的主要方向:

  • John Schulman,OpenAI聯(lián)創(chuàng),ChatGPT架構(gòu)師
  • Barrett Zoph,OpenAI前研究副總裁,后訓(xùn)練專(zhuān)家
  • 翁荔,OpenAI前AI安全系統(tǒng)負(fù)責(zé)人,專(zhuān)長(zhǎng)AI安全
  • Andrew Tulloch,擅長(zhǎng)預(yù)訓(xùn)練&推理
  • Luke Metz,專(zhuān)注后訓(xùn)練
  • Alexander Kirillov,OpenAI前多模態(tài)研究負(fù)責(zé)人
  • ……

以及新加入的Kevin Lu,擅長(zhǎng)小模型和強(qiáng)化學(xué)習(xí)。

根據(jù)LinkedIn信息,Kevin Lu已于7月正式從OpenAI離職。幾乎同時(shí),Thinking Machine Lab完成破紀(jì)錄種子輪融資,估值飆升到120億美元。

而且在最近激烈的硅谷人才大戰(zhàn)中,Thinking Machine Lab獨(dú)善其身,十幾名成員無(wú)人接受小扎offer,10億美元薪酬都拒絕。

不過(guò)Thinking Machine Lab目前還未公開(kāi)任何成果,倒是讓人更加期待了。

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2025-08-19 15:58:59

OpenAI模型架構(gòu)

2025-01-02 12:48:36

2025-07-16 12:51:24

2025-01-02 11:00:34

2024-09-26 14:07:30

2024-07-22 15:13:24

2025-03-17 08:34:00

模型代碼開(kāi)發(fā)

2024-09-02 08:30:00

大模型AI

2025-05-13 08:24:14

2025-04-23 08:30:05

2024-12-23 07:10:00

o3-miniARC-AGI人工智能

2015-05-11 17:21:33

Google IO2015

2022-12-08 17:15:54

Java并發(fā)包

2025-08-27 09:05:00

Meta強(qiáng)化學(xué)習(xí)模型

2025-07-01 09:10:42

2025-04-17 08:59:59

2025-10-13 09:00:00

2025-08-20 12:41:10

2025-02-25 12:30:00

2025-05-28 11:55:28

模型AI評(píng)估
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)