奧特曼:自認(rèn)比o1聰明請舉手??到o2還這么想么???|OpenAI開發(fā)者日
奧特曼:認(rèn)為自己比o1更聰明的請舉手。
(臺下一些人舉手)
奧特曼:到了o2你們還會這么想么?
(汗流浹背了)
這一幕,剛剛在OpenAI開發(fā)者日最后一個(gè)環(huán)節(jié)——奧特曼爐邊談話中上演。
對話由奧特曼和OpenAI首席產(chǎn)品官Kevin Weil進(jìn)行,奧特曼還對未來作出如下判斷:
- 無限上下文長度將在十年內(nèi)發(fā)生
- o1正在推動(dòng)智能體應(yīng)用,人們將要求AI在一小時(shí)內(nèi)完成以前人類數(shù)月或數(shù)年的工作
- 然后每個(gè)人將擁有10個(gè)智能體,再然后擁有1000個(gè)
- 擔(dān)心科幻(Sci-fi)是我們最重要的事之一
除此之外,活動(dòng)上宣布了OpenAI API大量重磅更新:
- 實(shí)時(shí)語音API:每個(gè)APP里都可以擁有“Her”
- 視覺微調(diào)API:只需100張圖提升GPT-4o特定任務(wù)圖像理解能力
- 自動(dòng)提示詞緩存:模型最近見過的輸入tokens統(tǒng)統(tǒng)打5折
- 模型蒸餾API:用前沿模型的輸出微調(diào)GPT-4o mini
圍繞這些功能的精彩現(xiàn)場演示,也引起眾人圍觀。
比如GPT-4o驅(qū)動(dòng)的實(shí)時(shí)語音API, 配合函數(shù)調(diào)用+Twillio(云通訊服務(wù)),可以直接打電話訂外賣了。
訂購400個(gè)草莓裹巧克力醬甜點(diǎn),參會者人人都有的吃。
看起來演示現(xiàn)場是OpenAI員工在臺上扮演食品店員工,真正的訂購過程是在幕后完成。
沒過一會,還有人曬會場外草莓快被領(lǐng)完了。
最新發(fā)布的推理大模型o1也露了一手,從頭編程操控?zé)o人機(jī),現(xiàn)場蕪湖起飛。
這邊大會辦得熱鬧,與OpenAI相關(guān)的周邊消息也不斷傳出:
剛剛離職的幾位中,前研究VP Barret Zoph已決定要成立一家新公司。
前CTO Mira Murati還沒宣布下一步要干什么,但投資人開始圍追堵截她,希望她盡快成立自己的公司。
還有一位此前已離職的OpenAI聯(lián)合創(chuàng)始人Durk Kingma,宣布加入隔壁Anthropic。
OpenAI開發(fā)者日
與去年相比,今年的OpenAI開發(fā)者日活動(dòng)不再現(xiàn)場直播,并拆分成三部分在不同地點(diǎn)舉辦(美國、英國、新加坡)。
剛剛在舊金山舉辦的第一場,宣布了多項(xiàng)API更新。
Realtime API
實(shí)時(shí)語音API為公開測試版,所有開發(fā)者都能在自己的APP中構(gòu)建與ChatGPT高級語音模式類似的體驗(yàn)。
價(jià)格也不貴,每分鐘音頻輸入約0.06美元,每分鐘音頻輸出約0.24美元。
語言學(xué)習(xí)應(yīng)用Speak已使用Realtime API開發(fā)AI角色扮演練口語功能。
,時(shí)長00:15
此外還在Chat Completions API中增加了音頻輸入和輸出,可以用在對時(shí)延要求不高的地方,將在未來幾周內(nèi)作為gpt-4o-audio-preview發(fā)布。
視覺微調(diào)
開發(fā)者現(xiàn)在可以用圖像對GPT-4o微調(diào),以提高視覺能力。
可以用來增強(qiáng)視覺搜索功能、改進(jìn)自動(dòng)駕駛汽車或智能城市的物體檢測以及更準(zhǔn)確的醫(yī)學(xué)圖像分析等應(yīng)用。
如外賣和共享出行公司Grab,將車道計(jì)數(shù)的準(zhǔn)確性提高20%,將限速標(biāo)志的定位提高13%。
在UI設(shè)計(jì)上,微調(diào)過的GPT-4o生成的網(wǎng)頁區(qū)域也能更好匹配整個(gè)頁面的風(fēng)格。
視覺微調(diào)的過程與文本微調(diào)類似,按照OpenAI指定的格式準(zhǔn)備圖像數(shù)據(jù)集,然后將數(shù)據(jù)集上傳到OpenAI開發(fā)平臺
只需使用100張圖像就能提高GPT-4o在視覺任務(wù)中的性能,當(dāng)然用的更多提升也能更大。
GPT-4o的微調(diào)費(fèi)用為$25/100萬tokens,微調(diào)后推理費(fèi)用為每 100 萬個(gè)輸入tokens 3.75美元,每100萬個(gè)輸出令牌15美元。
不過在2024年10月31日之前,每天免費(fèi)為視覺微調(diào)提供100萬個(gè)訓(xùn)練token。
羊毛薅起來~
提示詞緩存
許多開發(fā)者在構(gòu)建人工智能應(yīng)用程序時(shí),會在多個(gè)API調(diào)用中重復(fù)使用相同的上下文,例如在編輯代碼庫或與聊天機(jī)器人進(jìn)行長時(shí)間、多輪對話時(shí)。
提示詞緩存功能可以在降低成本的同時(shí)降低推理延遲。
OpenAI推出這個(gè)功能是比較晚的,此前谷歌Gemini、Claude,以及國內(nèi)DeepSeek,Kimi等都已上線。
不過OpenAI搞出來的特色在于:一切都是自動(dòng)的。
從今天起,提示詞緩存已適配最新版本的GPT-4o、GPT-4o mini、o1-preview和o1-mini,以及這些模型的微調(diào)版本。
只要是AI見過的token,自動(dòng)統(tǒng)統(tǒng)打五折。
緩存將在閑置5-10分鐘后清除,最多保留1小時(shí)。
模型蒸餾
讓開發(fā)者可以用o1-preive和GPT-4o等前沿模型的輸出,對GPT-4o mini等小模型微調(diào)。
此前,模型蒸餾是一個(gè)多步驟、易出錯(cuò)的過程,需要開發(fā)人員在互不關(guān)聯(lián)的工具中手動(dòng)協(xié)調(diào)多個(gè)操作,從生成數(shù)據(jù)集到微調(diào)模型和評估性能。
由于蒸餾本質(zhì)上是迭代的,需要反復(fù)運(yùn)行每個(gè)步驟,大大增加了工作量和復(fù)雜性。
這次OpenAI推出了新的集成工作流程,可自動(dòng)獲得前沿模型生成的輸入-輸出對、運(yùn)行自定義評估、以及完成微調(diào)。
同樣在10月31日之前,在GPT-4o mini上每天提供200萬個(gè)免費(fèi)培訓(xùn)token,在GPT-4o上每天提供100萬個(gè)免費(fèi)訓(xùn)練token。
離職高管被資本熱捧,聯(lián)創(chuàng)加入Claude團(tuán)隊(duì)
OpenAI持續(xù)發(fā)布新模型、新功能的壓力,讓OpenAI內(nèi)部研究和安全團(tuán)隊(duì)疲于奔命,難以跟上步伐。
此前已有消息證實(shí)GPT-4o發(fā)布前,團(tuán)隊(duì)只有9天時(shí)間做安全評估,每天工作20多個(gè)小時(shí)。
財(cái)富雜志最新消息表示,o1發(fā)布前也遇到了同樣的情況,并且在公司高層之間引發(fā)了摩擦。
許多向前CTO Mira Murati匯報(bào)工作的團(tuán)隊(duì)都認(rèn)為o1還沒有做好發(fā)布的準(zhǔn)備,還沒有真正形成產(chǎn)品,不過他們的反對意見被駁回了。
除了奧特曼之外唯一還在的聯(lián)創(chuàng)Woijceich Zarembra發(fā)聲,承認(rèn)了在o1開發(fā)階段他和后訓(xùn)練團(tuán)隊(duì)負(fù)責(zé)人Barret Zoph發(fā)生激烈沖突,但沒有透露詳細(xì)細(xì)節(jié)。
現(xiàn)在后訓(xùn)練團(tuán)隊(duì)仍在繼續(xù)完善o1,但Barret Zoph已經(jīng)辭職了。
Barret Zoph目前表示將成立一家新公司,但目前尚不清楚他具體會做什么,也不清楚他是否會和Murati合作。
再看Murati這邊,她本人還沒有宣布下一步任何計(jì)劃,但投資人爭相與她會面,希望她盡快創(chuàng)辦自己的公司。
據(jù)Business Insider消息,許多投資人正在試圖接近她,即使以前沒有聯(lián)系過的也會給她發(fā)冷郵件。
作為去年11月奧特曼被短暫趕下臺的余波,OpenAI高層持續(xù)動(dòng)蕩,已經(jīng)流失不少研究和管理人才。
與此同時(shí),OpenAI 一直在瘋狂招聘,規(guī)模相比去年擴(kuò)大了一倍多,員工人數(shù)從不到800人增加到1800人。
有老員工開始抱怨:新員工的涌入改變了OpenAI的氛圍和文化。
關(guān)于研究的對話少了,關(guān)于產(chǎn)品或向社會部署的對話多了。
離職的OpenAI研究人才中,有相當(dāng)一部分去了隔壁Anthropic。
聯(lián)合創(chuàng)始人John Schulman、超級對齊負(fù)責(zé)人Jan Leike跳槽加入之后,Anthropic又吸引來一位早年已經(jīng)離職的OpenAI聯(lián)創(chuàng)Durk Kingma。
Durk Kingma博士畢業(yè)于阿姆斯特丹大學(xué),師從機(jī)器學(xué)習(xí)大牛Max Welling。
兩人合作開發(fā)了變分自編碼器VAE,相關(guān)論文于今年獲得ICLR首屆時(shí)間檢驗(yàn)獎(jiǎng)。
Durk Kingma于2018年離開OpenAI,做了一段時(shí)間天使投資人,后加入谷歌大腦,再后來被合并進(jìn)了Google DeepMind。
這次他加入Anthropic將主要在荷蘭遠(yuǎn)程辦公,沒有透露他將具體加入哪個(gè)團(tuán)隊(duì)或負(fù)責(zé)哪部分工作。
總之OpenAI變得不像以前的自己,但隔壁Anthropic越來越像以前的OpenAI了。
還有人提出,如果去年11月奧特曼真的下臺了,OpenAI現(xiàn)在會不會更好呢?
健康的公司,有優(yōu)秀的CEO,不會用報(bào)酬威脅員工簽封口協(xié)議,也不會有高管辭職,更不會有那么多丑聞。
OpenAI發(fā)布https://openai.com/index/introducing-the-realtime-api/
https://openai.com/index/introducing-vision-to-the-fine-tuning-api/
https://openai.com/index/api-prompt-caching/
https://openai.com/index/api-model-distillation/