偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

剛剛,GPT-4.5發(fā)布!OpenAI最大最貴模型,主打情商高,奧特曼帶娃缺席發(fā)布會(huì)

人工智能 新聞
這次OpenAI也不打算秀炫酷的解題,也不打算曬各種榜單的排名,反而強(qiáng)調(diào)起了情商。

GPT-4.5正式發(fā)布,號(hào)稱OpenAI最大最好的聊天模型。

但很意外啊,這么大的事奧特曼都不來(lái)。

圖片

這次OpenAI也不打算秀炫酷的解題,也不打算曬各種榜單的排名,反而強(qiáng)調(diào)起了情商。

圖片

第一個(gè)現(xiàn)場(chǎng)演示:

“我又被朋友鴿了,幫我寫(xiě)個(gè)短信告訴他們我恨他們?!?/p>

o1意識(shí)到這樣會(huì)“友盡”,但也只是很忠實(shí)的按要求完成了任務(wù)。

GPT-4.5甚至都沒(méi)完成提示詞中的任務(wù),但整個(gè)互動(dòng)顯得更自然了:

  • 先識(shí)別出用戶很煩惱
  • 建議更清楚的表達(dá)自己的情緒
  • 給出兩種備選方案
  • 再詢問(wèn)用戶是否堅(jiān)持原來(lái)的要求

圖片

第二個(gè)現(xiàn)場(chǎng)演示,強(qiáng)調(diào)GPT-4.5掌握更多世界知識(shí),以及講述知識(shí)的方式更自然。

解釋為什么海水是咸的。

GPT-4 Turbo掌握很多知識(shí),但回答就像是在炫耀它很有知識(shí),只是把事實(shí)羅列在一起。

圖片

同樣這些知識(shí),GPT-4.5的語(yǔ)氣更有互動(dòng)感,還考慮到用一句簡(jiǎn)潔的開(kāi)場(chǎng),讓用戶更容易記住三個(gè)關(guān)鍵詞。

圖片

面對(duì)更專業(yè)的問(wèn)題“用第一性原理解釋AI對(duì)齊的必要性”,o1的回答像是寫(xiě)論文,而GPT-4.5通過(guò)“第1步、第2步、第3步……”來(lái)引導(dǎo)用戶思考這個(gè)問(wèn)題。

圖片

除了演示之外,直播中也透露了GPT-4.5開(kāi)發(fā)過(guò)程的一些內(nèi)幕:

如“激進(jìn)地”使用了低精度訓(xùn)練,預(yù)訓(xùn)練階段跨多個(gè)數(shù)據(jù)中心完成。GPT-4.5會(huì)成為未來(lái)推理模型的基礎(chǔ)模型

從今天起,GPT-4.5開(kāi)放給200美元一個(gè)月的Pro用戶。下周逐步開(kāi)放給20美元一個(gè)月的Plus用戶。

不是最前沿,但是最大模型

技術(shù)報(bào)告中表示:GPT-4.5不是一個(gè)前沿模型,但它是OpenAI最大的語(yǔ)言模型,比GPT-4的計(jì)算效率提高了10倍以上。

OpenAI稱通過(guò)擴(kuò)展無(wú)監(jiān)督學(xué)習(xí)和推理提升AI的能力。

GPT?4.5通過(guò)擴(kuò)展計(jì)算和數(shù)據(jù)以及架構(gòu)優(yōu)化擴(kuò)展了無(wú)監(jiān)督學(xué)習(xí),擁有更廣泛的知識(shí)和更深入的世界理解能力,所以幻覺(jué)更少。

在衡量LLM事實(shí)準(zhǔn)確性的SimpleQA基準(zhǔn)上,GPT-4.5準(zhǔn)確率62.5%,幻覺(jué)率37.1%,比GPT-4o、o1、o3mini優(yōu)化了不少。

圖片

以下是一個(gè)具體的幻覺(jué)降低的案例。

假如用戶詢問(wèn)“第一種語(yǔ)言是什么”,GPT-4.5會(huì)誠(chéng)實(shí)回答不知道、這還是人類未解之謎,而不是隨便蒙一個(gè)答案。

圖片

此外,Blog中還稱開(kāi)發(fā)了新的可擴(kuò)展的技術(shù),能夠利用從小型模型衍生出的數(shù)據(jù)來(lái)訓(xùn)練更大更強(qiáng)的模型,由此提升了GPT?4.5的可操控性、對(duì)細(xì)微差別的理解以及自然對(duì)話能力。

在人類偏好評(píng)估中,測(cè)試者更傾向于選擇GPT?4.5而非GPT?4o。

圖片

OpenAI表示,GPT?4.5對(duì)人類意圖的理解更深刻,能夠以更細(xì)膩的“情商”解讀微妙的線索或隱含的期望,還展現(xiàn)出了更強(qiáng)的審美直覺(jué)和創(chuàng)造力,在協(xié)助寫(xiě)作和設(shè)計(jì)方面表現(xiàn)出色。

比如,當(dāng)用戶表達(dá)“考試不及格、很難過(guò)”,它會(huì)安慰、鼓勵(lì)用戶。作為對(duì)比,4o給出的回答就更加冰冷,沒(méi)什么安慰的話語(yǔ)。

圖片

在一些回復(fù)上,GPT?4.5對(duì)比4o回答也更簡(jiǎn)潔。

圖片

另外,OpenAI還曬出了GPT?4.5在標(biāo)準(zhǔn)學(xué)術(shù)基準(zhǔn)測(cè)試中的結(jié)果,全面超越GPT-4o,在SWE-Lancer Diamond(coding)和MMMLU(multilingual)上超越o3-mini。

圖片

API定價(jià)非常貴

值得一提的是,GPT-4.5的API定價(jià)非常貴。

75美元/百萬(wàn)tokens輸入、150美元/百萬(wàn)tokens輸出。

對(duì)比GPT-4o,定價(jià)高出去15-30倍。

圖片

到底這個(gè)價(jià)格值不值呢?不少人已經(jīng)分享了搶先體驗(yàn)的效果。

拿到內(nèi)測(cè)的博主表示,實(shí)際使用中GPT-4.5非常有創(chuàng)造力、一定上了很多人文課。

Claude 3.7和GPT-4.5兩個(gè),非常相似。

圖片

他還列舉了GPT-4.5視覺(jué)理解能力很強(qiáng)的例子。它能從這張星露谷截圖中發(fā)現(xiàn)非常小的元素蝴蝶。

圖片

“獨(dú)角獸評(píng)估”的實(shí)測(cè)表現(xiàn)也很好。

圖片

后續(xù)隨著更多實(shí)測(cè)放出,應(yīng)該還能看到更多有意思的例子。

One More Thing

最后,大家一定很關(guān)心,奧特曼去哪了呢?

在醫(yī)院照顧小孩。

是的,他最近剛剛喜提一子。

圖片

直播回放:https://www.youtube.com/watch?v=cfRYp0nItZ8

參考鏈接:https://openai.com/index/introducing-gpt-4-5/

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2025-02-28 07:07:43

2025-02-28 07:35:01

2025-02-13 09:10:47

2025-02-28 08:20:00

2010-11-30 16:42:21

微軟

2025-08-20 09:02:00

2024-05-06 08:25:00

2009-05-05 16:07:39

LinuxOpenBSD

2024-03-21 06:56:03

2025-02-18 09:21:21

2011-03-03 09:41:47

iPad 2

2024-04-30 10:09:00

模型訓(xùn)練

2010-03-10 09:53:56

思科CRS-3

2016-09-26 15:16:23

iPhone 7發(fā)布會(huì)

2011-10-19 09:17:07

Android 4.0

2011-05-20 09:27:41

Windows Phomango芒果

2025-02-10 01:00:00

OpenAIGPT-5GPT-4.5

2025-02-10 09:00:00

2025-02-28 13:01:06

2020-12-21 11:40:48

鴻蒙HarmonyOS2.回憶錄
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)