最豪華大模型創(chuàng)業(yè)陣容!OpenAI前CTO組建,翁荔、Schulman等ChatGPT核心成員加盟
今天凌晨,一個創(chuàng)業(yè)消息引爆了整個 AI 社區(qū):一家名為 Thinking Machines Lab 的新創(chuàng)業(yè)公司建立了,而其背后有一個堪稱有史以來最豪華的大模型創(chuàng)業(yè)團隊陣容。

據(jù)該公司的首條推文介紹,Thinking Machines Lab 是一家「人工智能研究和產(chǎn)品公司?!?/p>

他們還強調(diào)這會是一家重視研究開放的公司,其推文中承諾:「我們致力于通過論文發(fā)表和代碼發(fā)布來開放科學,同時會重點關(guān)注應(yīng)用于不同領(lǐng)域的人機協(xié)作。我們的方法包括共同設(shè)計研究和產(chǎn)品,以便從實際部署和快速迭代中學習。這項工作需要三個核心基礎(chǔ):SOTA 的模型智能、高質(zhì)量的基礎(chǔ)設(shè)施和先進的多模態(tài)能力。我們致力于構(gòu)建處于能力領(lǐng)先的模型來兌現(xiàn)這一承諾。」
該公司官方網(wǎng)站對這三核心基礎(chǔ)進行了展開說明:
- 模型智能是基石。除了強調(diào)人機協(xié)作和定制之外,模型智能也至關(guān)重要,我們正為科學和編程等領(lǐng)域構(gòu)建前沿能力模型。最終,最先進的模型將解鎖最具變革性的應(yīng)用和優(yōu)勢,例如實現(xiàn)新穎的科學發(fā)現(xiàn)和工程突破。
 - 基礎(chǔ)設(shè)施質(zhì)量是重中之重。研究生產(chǎn)力至關(guān)重要,在很大程度上取決于基礎(chǔ)設(shè)施的可靠性、效率和易用性。我們的目標是長期正確地構(gòu)建事物,以最大限度地提高生產(chǎn)力和安全性,而不是走捷徑。
 - 先進的多模態(tài)能力。我們認為多模態(tài)對于實現(xiàn)更自然、更高效的通信、保存更多信息、更好地捕捉意圖以及支持與現(xiàn)實環(huán)境的更深入集成至關(guān)重要。
 
此外,尤其值得關(guān)注是該公司背后的豪華團隊陣容,其中包括多位前 OpenAI 重要成員,如擔任首席科學家的 John Schulman、著名 AI 研究科學家和博客作家翁荔。

上述推文中也寫到:「我們是一些最廣泛使用的 AI 產(chǎn)品和軟件背后的科學家、工程師和構(gòu)建者,包括 ChatGPT、Character.ai、PyTorch 和 Mistral。我們的使命是讓 AI 為您服務(wù),打造一個每個人都能獲得知識和工具的未來,讓 AI 能夠滿足每個人獨特的需求?!?/p>
下面我們簡要介紹下 Thinking Machines Lab 背后的這個豪華創(chuàng)業(yè)團隊:
Mira Murati(CEO)

Thinking Machines Lab 的 CEO 為 OpenAI 前 CTO Mira Murati,他曾在 OpenAI 領(lǐng)導過研究、產(chǎn)品與安全方面的工作。去年 9 月,Murati 離開了 OpenAI。
Mira 于 1988 年出生于阿爾巴尼亞,在 2022 年擔任 OpenAI 的首席技術(shù)官。
在學生時代,Mira 就參加過許多奧林匹克競賽和數(shù)學競賽。她本科畢業(yè)于達特茅斯學院機械工程系,曾在高盛和法國航空航天集團 Zodiac Aerospace 實習。她還在特斯拉工作了三年,擔任特斯拉跨界 SUV Model X 的高級產(chǎn)品經(jīng)理,在此期間,特斯拉發(fā)布了 Autopilot 的早期版本。
2016 年,Mira 加入 Leap Motion,一家為 PC 制造手部和手指追蹤運動傳感器的初創(chuàng)公司,擔任產(chǎn)品和工程副總裁。Mira 在接受外媒 Fast Company 采訪時表示,她希望人類與計算機的交互體驗「像玩球一樣直觀」。
加入 OpenAI 后,Mira 在 ChatGPT、DALL-E、Codex 等的開發(fā)中發(fā)揮了重要作用。除此以外,今年 5 月份發(fā)布的 GPT-4o 以及本月發(fā)布的 OpenAI o1,都是在 Mira 的領(lǐng)導下完成的。
John Schulman(首席科學家)

個人主頁:http://joschu.net/
John Schulman 將擔任這家新創(chuàng)業(yè)公司的首席科學家。本月初,John Schulman 宣布辭去 Anthropic 的職務(wù)。距離他加入這家人工智能初創(chuàng)公司,僅僅過去了半年時間。
他是深度強化學習的一位先驅(qū)研究者,創(chuàng)造了著名的 PPO 算法。同時也是 OpenAI 的創(chuàng)始人之一,曾共同領(lǐng)導過 ChatGPT 和 OpenAI 后訓練團隊。
谷歌學術(shù)頁面顯示,John Schulman 的學術(shù)引用總數(shù)已經(jīng)超過 10 萬。其中,引用量最高的研究便是他創(chuàng)造的 PPO 算法《Proximal policy optimization algorithms》。
他在加州大學伯克利分校獲得了計算機科學博士學位,導師為該校教授、深度強化學習大牛 Pieter Abbeel。之后從事機器人和強化學習研究與工作。在此之前,他還曾在伯克利短暫學習過神經(jīng)科學,并在加州理工學院學習過物理學。
Barret Zoph(CTO)

個人主頁:https://barretzoph.github.io/
擔任這家新創(chuàng)業(yè)公司 CTO 的是 Barret Zoph,也曾是 OpenAI 的一位技術(shù)主管,領(lǐng)導過 OpenAI 的后訓練團隊,涉及的研究方向包括對齊、工具使用、評估、ChatGPT、搜索、多模態(tài)等等。同時,他還是一位專注投資 AI 公司的天使投資人。
此前,他還曾在谷歌與信息科學學院擔任過研究科學家,參與訓練了大型稀疏語言模型并將其應(yīng)用于各種應(yīng)用的研究工作。
他是兩篇重要論文《Learning transferable architectures for scalable image recognition》和《Neural architecture search with reinforcement learning》的第一作者。
下面按名字首字母排序介紹 Thinking Machines Lab 創(chuàng)始團隊其他成員。
Alex Gartrell

個人主頁:https://www.alexgartrell.com/
Alex Gartrell 曾任 Meta 服務(wù)器操作系統(tǒng)負責人,Linux 內(nèi)核、網(wǎng)絡(luò)和容器化專家。
Alexander Kirillov

個人主頁:https://alexander-kirillov.github.io/
Alexander Kirillov 將在 Thinking Machines Lab 從事多模態(tài) AI 的研究和開發(fā)。他曾參與開發(fā)了 OpenAI 高級語音模式和 Meta AI 的 Segment Anything Model(SAM),并曾任 OpenAI 多模態(tài)后訓練負責人。
他在德國海德堡大學獲得博士學位,指導老師是 Carsten Rother。
Andrew Tulloch

個人主頁:https://tullo.ch/
Andrew Tulloch 同樣也曾在 OpenAI 與 Meta 工作過,他的主攻方向是機器學習系統(tǒng)的相關(guān)研究與工程開發(fā)。
Tulloch 還是一位開源社區(qū)的重要參與者,為著名開源項目 PyTorch 和 Caffe 做出過重要貢獻。
Brydon Eastman

曾在 OpenAI 從事訓練后研究,專攻人類和合成數(shù)據(jù)、模型對齊和 RL。
Christian Gibson
曾任 OpenAI 基礎(chǔ)設(shè)施工程師,專注于訓練前沿模型的超級計算機。
Devendra Chaplot

Mistral AI 創(chuàng)始團隊成員兼多模態(tài)研究主管,Mixtral 和 Pixtral 的共同創(chuàng)始人。VLM、RL 和機器人技術(shù)專家。
Ian O'Connell
基礎(chǔ)設(shè)施工程,曾就職于 OpenAI、Netflix、Stripe。
Jacob Menick

ML 研究員,曾領(lǐng)導 OpenAI 的 GPT-4o-mini,之前曾為 ChatGPT 和 DeepMind 的深度生成模型創(chuàng)建做出過貢獻。
Jonathan Lachman
運營主管、前 OpenAI 特別項目負責人和白宮國家安全預算主管。
Joshua Gross

在 OpenAI 參與構(gòu)建產(chǎn)品和研究基礎(chǔ)設(shè)施,塑造 ChatGPT 的學習系統(tǒng)和 GPU 集群;此前在 Meta 負責產(chǎn)品基礎(chǔ)設(shè)施。
Kurt Shuster

曾參與 Google DeepMind 的推理、Character.AI 的全棧預訓練和推理以及 Meta AI 的基礎(chǔ)對話研究。
Kyle Luther

機器學習研究員,此前他在 OpenAI 任職。
(翁荔)Lilian Weng

曾任 OpenAI 研究(安全)副總裁。
Lilian Weng 是 OpenAI 華人科學家,她 2018 年加入 OpenAI,參與了 GPT-4 項目的預訓練、強化學習 & 對齊、模型安全等方面的工作。她本科畢業(yè)于北大,曾前往香港大學進行短期交流,博士畢業(yè)于印第安納大學伯明頓分校。
根據(jù)領(lǐng)英資料顯示,Lilian Weng 在 OpenAI 已經(jīng)工作了近 7 年時間,擔任安全研究副總裁一職。2021 年 - 2023 年工作期間,Lilian Weng 建立并領(lǐng)導了應(yīng)用人工智能研究團隊,包括產(chǎn)品研究、合作伙伴研究和應(yīng)用安全,從而使得 OpenAI 的 API 更強大、更實用、更安全。之前,她還是 OpenAI 機器人團隊的技術(shù)主管,專注于訓練關(guān)于機器人任務(wù)的算法,如教機械手如何解決魔方、旋轉(zhuǎn)方塊等。
在加入 OpenAI 之前,她還在 Facebook、Dropbox 從事軟件工程和數(shù)據(jù)科學方面的工作。Google Scholar 顯示,Lilian Weng 論文引用量超過 13000 多次。閑暇時間,Lilian Weng 還寫了一些關(guān)于 AI 的博客文章,她的博客深入、細致,具有前瞻性,被很多 AI 研究者視為重要的參考資料
Luke Metz

Luke Metz 是 OpenAI 創(chuàng)始團隊成員,曾與 John Schulman、Barret Zoph、Liam Fedus 等人在內(nèi)部共同開發(fā)了「low-key research preview」,這是 ChatGPT 的雛形。他也是 o1 推理模型背后的貢獻者之一。
Mario Saltarelli
OpenAI 前 IT 和安全主管。
Myle Ott

人工智能研究員,Character.AI 創(chuàng)始團隊成員,Meta 早期 LLM 負責人,F(xiàn)SDP 和 fairseq 的創(chuàng)建者。
Nikki Sommer
曾任 OpenAI 人力資源業(yè)務(wù)副總裁及 Twitter 人力資源業(yè)務(wù)總監(jiān)。
Noah Shpak
ML 工程師。
Pia Santos
執(zhí)行運營主管,曾在 OpenAI 任職。
Randall Lin
曾在 OpenAI 負責 ChatGPT,并在 X 擔任「Twitter 算法」的聯(lián)合技術(shù)負責人。
Rowan Zellers
曾在 OpenAI 工作,從事實時多模態(tài)后訓練工作。
Sam Schoenholz

曾領(lǐng)導 OpenAI 的可信賴擴展團隊和 GPT-4o 優(yōu)化。之前曾在 Google Brain 從事統(tǒng)計物理學與機器學習的交叉研究。
Sam Shleifer

專注于推理的研究工程師,曾就職于 Character.AI、Google DeepMind、FAIR、HuggingFace。
Stephen Chen
Stephen Chen 是在 Meta 工作近十五年的老員工,此前領(lǐng)導人工智能推理相關(guān)研究,負責 Meta 的生成式人工智能產(chǎn)品和推薦系統(tǒng)。
Stephen Roller

之前曾在 DeepMind、CharacterAI 和 MetaAI 進行全棧預訓練相關(guān)工作。在 Google DeepMind 時,他的研究和工作主要集中在對最大規(guī)模語言模型進行預訓練。在 Character.AI 期間,他負責領(lǐng)導預訓練和訓練基礎(chǔ)設(shè)施工作。他還曾擔任 Meta 基礎(chǔ)人工智能研究 (FAIR) 的研究工程師,負責領(lǐng)導大型語言模型和對話團隊(FAIR 的大部分工作都是開源的)。
Yinghai Lu

Yinghai Lu 曾領(lǐng)導 OpenAI 和 Meta 的各種推理工作,本次離職前是 OpenAI 研究推理團隊的技術(shù)負責人。在 2023 年底加入 OpenAI 之前,他是 Facebook AI Infra 的軟件工程師,負責建立推薦推理系統(tǒng)和生成式 AI 模型,參與了 Llama 2 等項目。
他在 2010 年獲得復旦大學電子工程博士學位。畢業(yè)后在美國西北大學電子工程系從事博士后研究工作,之后加入灣區(qū)的工業(yè)界。加入 Thinking Machines Lab 后,他擔任 ML 系統(tǒng)工程師。















 
 
 












 
 
 
 