ChatGPT 被逼急了,連夜上線 o3-mini,并且還免費(fèi)......
也許是迫于 DeepSeek 的壓力,open ai 的負(fù)責(zé)人 薩姆·奧爾特曼,連發(fā)多個(gè) Twitter(現(xiàn)在是 X) 推出了新的模型 o3-mini,并且包含三個(gè)版本:low、medium 和 high,分別針對(duì)不同的性能和資源需求優(yōu)化。
圖片
現(xiàn)在,只要大家打開(kāi) chatgpt 的官網(wǎng),就可以看到大大的 o3-mini 的宣傳海報(bào):
圖片
圖片
雖然 o3-mini 的具體性能還沒(méi)有經(jīng)過(guò)廣泛的實(shí)戰(zhàn)驗(yàn)證,但是一些第三方的初步評(píng)測(cè)已經(jīng)流出。
尤其是發(fā)布 幾個(gè)小時(shí)后,加州大學(xué)的一位 AI 博士就對(duì)包括 o3-mini 在內(nèi)的多款大語(yǔ)言模型進(jìn)行了測(cè)試,評(píng)測(cè)指標(biāo)包括 Accuracy(準(zhǔn)確率) 和 Calibration Error(校準(zhǔn)誤差)
圖片
根據(jù)評(píng)測(cè)結(jié)果可以看到,在他的評(píng)測(cè)中 o3-mini (high) 模型的 準(zhǔn)確率為 13.0% 為全場(chǎng)最高。(PS:不過(guò)最高才 13% 是不是有點(diǎn)過(guò)于低了?)
這個(gè)結(jié)果一出來(lái),open ai 的負(fù)責(zé)人薩姆·奧爾特曼就立刻轉(zhuǎn)發(fā)了該 Twitter,并帶上了一個(gè) Sunday 沒(méi)有太看懂的話:“我們很快就需要再做另一場(chǎng)測(cè)試了......”。Sunday 猜測(cè)或許是 “很快還會(huì)推出新的模型?所以需要再做新的測(cè)試?”
圖片
不過(guò),無(wú)論如何。DeepSeek 的爆火和 o3-mini 的快速跟進(jìn),都表示 大語(yǔ)言模型的競(jìng)爭(zhēng)已經(jīng)進(jìn)入了一個(gè)全新的階段。
Sunday 認(rèn)為,這對(duì)于我們開(kāi)發(fā)者而言,絕對(duì)是 有益的! 因?yàn)檫@將代表著 獨(dú)立開(kāi)發(fā)者、個(gè)人公司、超級(jí)個(gè)體 將會(huì)擁有更多強(qiáng)大的工具和資源!