偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

GPT-5真身曝光,首測編程驚艷全網(wǎng)!一句話秒生游戲,OpenAI雙雄備戰(zhàn)AGI

人工智能 新聞
GPT-5更近了!今天,神秘模型Horizon Alpha火遍全網(wǎng),編碼首測性能逆天,各種三方基準(zhǔn)實(shí)測相繼放出。就在發(fā)布前夕,OpenAI核心大腦專訪坦言模型還有瓶頸,但堅(jiān)信Scaling Law沒有盡頭。

GPT-5的發(fā)布前兆,愈發(fā)強(qiáng)烈了。

今早,一款神秘模型Horizon Alpha突然上線OpenRouter,各種榜單和測試席卷了全網(wǎng)。

圖片

Horizon Alpha模型的上下文為256K,響應(yīng)極速,非常擅長創(chuàng)意寫作。

它還具備了「推理」功能,不過,推理token的預(yù)算是o4-mini的兩倍。

圖片

在編程方面,Horizon Alpha堪稱無敵了。

它可以一句話生成「水果忍者」、「外星人抓奶?!沟雀鞣N游戲,能根據(jù)logo圖直出廣告,還能輕而易舉地通過「六邊形物理模擬」測試。

圖片

圖片

圖片

圖片

在寫作EQ-Bench基準(zhǔn)測試中,Horizon Alpha位列第一,遠(yuǎn)超o3、Gemini 2.5 Pro。

圖片

圖片

圖片

更令人驚嘆的是,它竟能在30秒內(nèi),完成20位數(shù)與20位數(shù)的乘法運(yùn)算。

圖片

此前被爆料的各種代號模型,比如lobster、zenith、summit等,在多項(xiàng)測試中驚艷了所有人。

種種跡象表明,GPT-5「全家桶」絕對是個(gè)地表最強(qiáng)模型。

圖片

谷歌收錄GPT-5的OpenAI文檔頁面,目前404

關(guān)于Horizon Alpha的更多細(xì)節(jié),全部濃縮在網(wǎng)友的實(shí)測中了。

神秘Horizon Alpha登場,編程強(qiáng)到逆天

目前,在OpenRouter平臺上,即可開啟對Horizon Alpha版本的測試。

圖片

傳送門:https://openrouter.ai/chat?room=orc-1754007231-sX8GtgCUyNkHh6O6In2l

在模型推理時(shí),相較于Claude Sonnet 4(60-80 token/s),Horizon Alpha的吞吐量是最快的,達(dá)120個(gè)token/s。

吞吐量對比測試,Horizon Alpha是目前最快的。

圖片

物理模擬驚艷,秒搭網(wǎng)頁

有網(wǎng)友讓其創(chuàng)建一個(gè)功能完整的Windows 95復(fù)古桌面,效果令人驚喜且生成速度極快。

圖片

另一個(gè)讓小球在多邊形中,模擬物理的測試。

不論是六邊形,還是三角形,即便小球可運(yùn)動的區(qū)間縮小,也不會影響效果。

圖片

再上點(diǎn)難度,20個(gè)球在旋轉(zhuǎn)的七邊形內(nèi)彈跳。網(wǎng)友驚訝地表示,「這是自己目前見過最出色的版本之一」。

圖片

Horizon Alpha能夠在3分48秒中,創(chuàng)建一個(gè)展示一系列簡單有趣的瀏覽器小游戲的網(wǎng)頁。

給Horizon Alpha同一個(gè)提示,「創(chuàng)建一個(gè)視覺上有趣的著色器,可以在 twigl 應(yīng)用中運(yùn)行,讓它看起來像暴風(fēng)雨中的海洋」。

沃頓商學(xué)院CS教授Ethan Mollick驚嘆道,這是迄今為止最好的,而且創(chuàng)建速度非???。

圖片

圖片

當(dāng)網(wǎng)友要求其「創(chuàng)建一個(gè)與遛狗的商業(yè)網(wǎng)站」,Horizon Alpha愛問一大堆需要提前確認(rèn)的問題;Sonnet 4則會直接給出解決方案。

圖片

左:Horizon Alpha;右:Claude Sonnet 4

最終,從搭建的效果來看,Horizon Alpha輸出的質(zhì)量高且簡潔。Sonnet 4輸出的更長,內(nèi)容更全面,也更具創(chuàng)意。

圖片

圖片

上:Horizon Alpha;下:Claude Sonnet 4

Horizon Alpha還會自主搭建一個(gè)銀行網(wǎng)站。

圖片

設(shè)計(jì)一絕,審美感在線

AI大佬Matthew Berman親自測試其SVG創(chuàng)建和UI設(shè)計(jì)功能,Horizon Alpha瞬間生成了一張專業(yè)設(shè)計(jì)美感的圖。

圖片

圖片

此前,AI圈大神Simon Willison曾表示,從一張「騎自行車的鵜鶘」就可以看透AI進(jìn)化史。

如今,用Horizon Alpha生成同款SVG測試,是所有模型當(dāng)中最強(qiáng)的那個(gè)。

圖片

其他一些SVG優(yōu)秀案例。

圖片

圖片

圖片

圖片

圖片

圖片

圖片

圖片

需要注意的是,雖然各種測試表現(xiàn)不凡,不過根據(jù)多方推測,Horizon Alpha可能只是一款小模型。

圖片

不管是GPT-5中的哪一款,接下來就坐等OpenAI發(fā)布了。

OpenAI「雙雄」專訪,奧特曼盛贊

就在GPT-5發(fā)布前夕,OpenAI雙雄——首席科學(xué)家Jakub Pachocki和研究主管Mark Chen重磅采訪同時(shí)放出了。

這對黃金搭檔,可是研發(fā)GPT-5的「雙巨頭」。

這篇由MIT Technology Review做的獨(dú)家專訪,沒想到深得奧特曼的心。

他對此大加贊賞,「我通常認(rèn)為這類文章說不到點(diǎn)上,但這篇確實(shí)抓住了兩人合作精髓」。

圖片

能夠得到奧特曼的高度認(rèn)可,究竟講了什么?

OpenAI最佳拍檔

熟悉OpenAI內(nèi)部人員變動的人都知道,Jakub Pachocki和Mark Chen都是后起之秀。

他們風(fēng)格迥異,卻形成了完美的互補(bǔ)。

Mark Chen,曾經(jīng)的華爾街量化交易員,著裝考究,談吐間揮灑自如,可以說與AI毫不搭界。

圖片

入職OpenAI后,他迅速成長為DALL·E和GPT-4多模態(tài)能力、Codex背后的關(guān)鍵推手,擅長將復(fù)雜的研究轉(zhuǎn)化為人人可用的產(chǎn)品。

而Jakub Pachocki,一位低調(diào)的理論計(jì)算機(jī)科學(xué)家,接替了離職后的Ilya,癡迷于突破AI邏輯與創(chuàng)造力的極限。

圖片

關(guān)于內(nèi)部的角色分工,Pachocki是這么說的,「Chen負(fù)責(zé)組建和管理研究團(tuán)隊(duì),而我負(fù)責(zé)設(shè)定研究路線圖,并確立我們長期的技術(shù)愿景」。

他們之間合作模式,可以說是「無縫切換」。

不論技術(shù)難題多么復(fù)雜,Pachocki和Mark總能非常默契,迅速分工合力攻克。

AGI標(biāo)尺,自主時(shí)間

當(dāng)前,外界對GPT-5的期待,是一款更強(qiáng)、更快、更全能的巨獸。

采訪中,Mark Chen雖未直面GPT-5問題,卻坦言「我們始終在努力理解深度學(xué)習(xí)的技術(shù)瓶頸,即便是當(dāng)前最強(qiáng)推理模型,也無法有效將知識串聯(lián)起來」。

圖片

Pachocki補(bǔ)充道,「我們?nèi)蕴幱谕评矸妒阶铋_端」。

如何讓一款模型進(jìn)行長期的學(xué)習(xí)和探索,并提出新穎的想法,才是至關(guān)重要。

同時(shí),在他們看來,Scaling Law遠(yuǎn)未觸及天花板,通過投入更多計(jì)算資源、數(shù)據(jù),模型就會變得越來越好。

被問題如何看待AGI時(shí),Mark Chen提出了一個(gè)指標(biāo)——模型能更長時(shí)間地自主工作的能力,即「自主時(shí)間」。

這個(gè)概念簡單卻深刻,它代表著AI在面對復(fù)雜問題時(shí),能持續(xù)取得進(jìn)展,而無需人類干預(yù)的時(shí)間長度。

這個(gè)愿景,遠(yuǎn)遠(yuǎn)超出了當(dāng)前模型的能力,自主時(shí)間僅限于幾分鐘到一小時(shí),遇到陌生場景往往會「卡住」。

數(shù)學(xué)+編程,摘下AI圣杯?

前段時(shí)間,OpenAI模型在兩項(xiàng)頂級競賽中取得佳績:

一是,在AtCoder世界巡回賽總決賽中獲第二名;二是,在IMO 2025大賽中奪下金牌。

圖片

在AtCoder比賽中,Psyho的勝利展現(xiàn)了人類獨(dú)有的創(chuàng)造性思維,類似AlphaGo當(dāng)年擊敗李世石的圍棋比賽。

Pachocki表示,「我們在這里談?wù)摰氖蔷幊毯蛿?shù)學(xué),但它實(shí)際上關(guān)乎創(chuàng)造力,提出新穎的想法,將不同領(lǐng)域的想法聯(lián)系起來」。

在他們二人看來,數(shù)學(xué)和編程是「通用智能」的基石。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-07-28 18:07:12

GPT-5GPT-5-prozenith

2015-08-03 10:21:04

設(shè)計(jì)模式表達(dá)

2020-11-27 09:57:11

Python代碼PyPy

2023-09-05 23:34:52

Kubernetes云原生

2025-07-29 09:03:00

2023-08-25 17:10:14

LLM人工智能

2025-08-06 09:17:24

2010-03-29 11:55:12

無線上網(wǎng)報(bào)錯(cuò)

2023-05-08 15:44:23

3D數(shù)字人

2023-08-28 00:53:03

AI3D

2025-01-24 08:30:00

2025-08-25 14:05:09

GPT-5視頻生成AI

2025-10-15 09:36:52

2018-01-15 10:45:43

社交網(wǎng)絡(luò)互聯(lián)網(wǎng)巨頭百度

2020-12-16 10:43:44

PythonPyPy代碼

2014-05-07 10:47:51

移動金融互聯(lián)網(wǎng)金融GMIC

2025-07-14 09:16:00

2019-08-15 11:42:56

程序員電腦軟件

2023-05-12 14:13:23

3D建模OpenAI

2023-06-12 15:20:38

視頻電影
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號