OpenAI重磅更新定檔下周一,奧特曼暗示會有「魔法」!
確認(rèn)了,沒有GPT-5,沒有搜索引擎,但還會有驚喜!
OpenAI今天官宣預(yù)告,即將在13日,下周一上午10點(太平洋時間)開啟線上直播。
屆時,會有全新的ChatGPT demo演示,以及GPT-4升級更新。
傳送門:https://openai.com/(OpenAI還在網(wǎng)頁UI整了個小心機(jī)設(shè)計,一點滿屏字頗有趣味)
而Altman本人更是興奮地表示,「對我來說,感覺就像魔法一樣」。
本來,發(fā)布「搜索引擎」這件事基本實錘,甚至連路透援引內(nèi)部人士消息這篇報道,昨天在全網(wǎng)瘋轉(zhuǎn)。
然而,發(fā)布時間是對上了,但奧特曼突然變卦,直言「沒有搜索引擎」。
據(jù)網(wǎng)友爆料,這是OpenAI投出的誘餌,目的是揪出內(nèi)部泄密者。而經(jīng)常給Jimmy Apples、Flowers泄密的爆料人,已經(jīng)被OpenAI解雇。
不得不說,還是OpenAI套路深。
那么,萬眾期待的GPT-5沒有,確認(rèn)了再確認(rèn)的「搜索引擎」也沒有,下周一OpenAI的「魔法」究竟是啥?
Information獨家報道,OpenAI正在開發(fā)一個全能的AI語音助手,預(yù)計在下周展示。
這項新技術(shù)可以通過聲音和文本,與人交流,可以聽出不同人的語調(diào)、語氣,并能識別物體和圖像。
網(wǎng)友紛紛表示,又是沒等到GPT-5的一天。
Her即將成真!AI語音助手要來
其實,OpenAI希望,能夠開發(fā)出一款像人類一樣交流的AI。
Altman曾表示,自己對Spike Jonze導(dǎo)演的電影《Her》深感興趣,并稱其具有預(yù)見性。
在這個影片中,講述了主人公愛上了一個對話操作系統(tǒng)——Semantha,并在互動過程中,AI也逐漸熟悉了他。
「她」記得他的故事,他的習(xí)慣,還發(fā)展出了自己的個性。
因此,打一開始,OpenAI致力于最終開發(fā)出類似于《Her》中的虛擬助手,同時讓現(xiàn)有語音助手,如Siri更加出色。
新模型有音頻輸入、音頻輸出功能,以及更好的推理能力。在一些查詢上甚至超過了GPT-4 Turbo
據(jù)兩位知情人士透露,OpenAI已經(jīng)向一些客戶展示了這項新技術(shù),包括優(yōu)于現(xiàn)有模型的邏輯推理能力在內(nèi)的多項能力。
而且,預(yù)計在下周一的活動中,將首次公開展示這款進(jìn)階后的AI。
可以確認(rèn)的是,OpenAI這波操作再次截胡谷歌,搶占奪人眼睛的先機(jī)。
谷歌預(yù)計在14日召開I/O大會(OpenAI掐點的直播時間真及時,簡直不給谷歌留下喘氣的機(jī)會)
據(jù)網(wǎng)友發(fā)現(xiàn),在Altman官宣不會發(fā)布「搜索引擎」,谷歌的股價立馬飆升。
精準(zhǔn)識別語調(diào)語氣,但體積太大裝不進(jìn)手機(jī)
OpenAI團(tuán)隊篤定的是,具備視覺+音頻能力的AI助手,可能會像智能手機(jī)一樣,將給世界帶來顛覆性的變革性。
ChatGPT,還只是這類強大AI助手的雛形。
理論上,他們設(shè)想的這款A(yù)I助手,可以完成不可能的任務(wù)。
比如,指導(dǎo)學(xué)生寫論文、解決數(shù)學(xué)難題,或人們詢問時,提供及時豐富的信息、翻譯標(biāo)志,甚至指導(dǎo)如何修理故障的汽車。
不幸的是,OpenAI這款A(yù)I目前體積太大,根本無法在個人終端設(shè)備運行。
不過,客戶可以在短期內(nèi)使用基于云的版本,來增強OpenAI已經(jīng)支持的軟件功能,例如自動客戶服務(wù)智能體。
另據(jù)了解這項AI的人透露,新軟件的音頻功能可以幫助,這些智能體更精準(zhǔn)地理解來電者的「語調(diào)」,以及他們是否在提出請求時使用「諷刺語氣」。
目前,OpenAI已經(jīng)開發(fā)了用于轉(zhuǎn)錄音頻(Whisper)以及文本轉(zhuǎn)語言(TTS)的模型。
ChatGPT背后便集成了這些能力,不過在用到的時候,需要分別調(diào)用這些工具。
據(jù)稱,OpenAI即將推出的新模型,將這些能力整合到一個模型之中,即打造一個「原生多模態(tài)模型」。
這個全新多模態(tài)模型,在理解圖像和音頻方面表現(xiàn)更佳,同時其響應(yīng)速度也超過了那些能力較弱的模型。
微軟搶先體驗
一如既往,OpenAI更新那天,作為「金主爸爸」的微軟,定是最先用上新功能的那個人。
預(yù)計,微軟將會利用OpenAI新技術(shù)升級自己的語音助手。
而且,他們設(shè)想試圖去壓縮這個技術(shù),以便將其「裝進(jìn)」包括配備前置攝像頭的可穿戴設(shè)備中,能夠捕捉到用戶的周圍環(huán)境。
不過,目前雖尚不清楚OpenAI何時會向其付費客戶提供這些新功能,但最終目標(biāo)是,將其納入ChatGPT的免費版本中。
據(jù)一位體驗過的人士透露,OpenAI的目標(biāo)是,讓具備新功能的AI模型的運營成本,低于其當(dāng)前收費的最尖端的模型GPT-4-Turbo。
他還指出,新模型在回答某些問題上表現(xiàn)得更好。然而,它依舊會出現(xiàn)「幻覺」。
GPT-5年底前發(fā),冰山之下深藏的秘密
OpenAI的領(lǐng)先優(yōu)勢,幾乎無人能及。
一直以來,谷歌高管夢想著,利用AI開發(fā)出強大的助手。
去年12年,谷歌首次展示了對話AI「Gemini」,能夠?qū)崟r響應(yīng)人的語音指令,并識別人類正在觀看的圖片。
一時間,這個宣傳視頻在全網(wǎng)掀起軒然大波,讓許多人瞬間對谷歌刮目相看。
沒想到,還沒發(fā)布一天,視頻竟被曝出「造假」?!
谷歌隨后解釋,這些能力的實現(xiàn),需要研究人員通過圖片和文本指令來引導(dǎo)模型,并非視頻所展示的那種簡單對話。
此后,隨著Gemini的迭代升級,也增加了一些新功能,除了分析圖像和文本之外,還能分析音頻。
盡管如此,它依舊不能理解多數(shù)傳統(tǒng)語音命令,也不能像Siri和Google Assistant等傳統(tǒng)語音助手那樣與用戶進(jìn)行交流。
而OpenAI即將發(fā)布的AI語音助手,或許對谷歌來說,又是一個致命性的打擊。
另外,OpenAI也在全力以赴,確保自己在AI領(lǐng)域的領(lǐng)先地位,不被主打「開源王牌」的Meta趕超。
今年4月,Llama 3的8B和70B版本發(fā)布,并預(yù)告了400B+開源大模型,直接狙擊GPT-4。
而具備「音頻+視覺」能力的AI模型,只是OpenAI正在開發(fā)的眾多產(chǎn)品之一。
雖這次不會發(fā)布「網(wǎng)絡(luò)搜索引擎」,但這件事確實在OpenAI內(nèi)部正在推進(jìn),就是為了與谷歌搜索競爭。
畢竟,OpenAI在上周的主頁中,已經(jīng)對外展示了一個新的UI。
此外,OpenAI還在開發(fā)一種自動化軟件,稱為「計算機(jī)操作智能體」(computer-using agent)。
該軟件有望加速軟件開發(fā),及其他計算機(jī)相關(guān)任務(wù)。
另外,今年年初,AI視頻生成器Sora的誕生,已經(jīng)在好萊塢掀起巨震,雖然目前尚未公開發(fā)布。
更重要的是,GPT-5也在默默推進(jìn)中,并且要顯著優(yōu)于GPT-4。知情人士透露,OpenAI可能在今年年底前完成GPT-5的開發(fā),并公開發(fā)布。
之所以,OpenAI內(nèi)部在產(chǎn)品和AI模型開發(fā)上進(jìn)展迅速,是因為此前宣布的項目,未能獲得足夠的關(guān)注。
比如,他們曾承諾開發(fā)者最在今年第一季度,通過構(gòu)建定制聊天機(jī)器人,來為其商店賺錢。
但到目前為止,OpenAI尚未推出實現(xiàn)這一目標(biāo)的具體方式。
ChatGPT裝進(jìn)iPhone,與蘋果合作基本達(dá)成
另一方面,打造視覺+音頻AI助手可以幫助OpenAI,將其能力引入數(shù)億,甚至數(shù)十億的蘋果設(shè)備中。
就在剛剛,彭博報道稱,蘋果與OpenAI正在敲定一項協(xié)議,貌似接近尾聲,基本達(dá)成。
這項協(xié)議,即將為今年的iOS提供全新的生成式AI能力。
此前,還曾爆出蘋果與谷歌就Gemini的談判正在進(jìn)行中,不過還未達(dá)成協(xié)議。
畢竟,距蘋果今年的開發(fā)者大會WWDC(6月10日),留給蘋果的時間不多了。
多家媒體爆料稱,這屆大會將AI整合進(jìn)全新iOS 18系統(tǒng)中。
對于大家的期待,蘋果可不想辜負(fù)。
硬件設(shè)備,OpenAI也要自己做
此外,Altman還與iPhone設(shè)計師Jony Ive合作,去開發(fā)一款獨立的AI消費設(shè)備。
Information曾報道,這款一個硬件可能從Emerson Collective和Thrive Capital等投資者那里,籌集到高達(dá)10億美元的資金。
過去一年,AI Pin、Rabbit R1等AI驅(qū)動的設(shè)備和可穿戴產(chǎn)品蜂擁而出,Altman此舉也是希望加入這一陣列。
不得不承認(rèn)的是,即便OpenAI最先進(jìn)的AI模型推出,也將因其龐大的規(guī)模,只限在云端運行,并且需要聯(lián)網(wǎng)操作。
而未來,若想讓復(fù)雜的具備「視覺+音頻」的對話AI,縮小到足以在設(shè)備上運行,可能還需要幾個月,甚至幾年的時間。
全網(wǎng)大預(yù)測:智能體、gpt4-lite...
OpenAI這波官宣,可謂是戳中了所有人的興奮點。
爆料人Jimmy Apples又來泄密,「預(yù)計下周,我們會看到智能體的發(fā)布」。
而「搜索引擎」可能會在蘋果WWDC大會上,一起發(fā)布。
OpenAI研究科學(xué)家Bowen Cheng甚至表示,要發(fā)的可比GPT-5酷多了。
不知為何,這個帖子目前卻被刪除了。
另一位OpenAI負(fù)責(zé)視頻生成的科學(xué)家Will Depue發(fā)了一張圖,不知在暗示著什么。
還有一位網(wǎng)友Siqi Chen預(yù)測下周一,在GPT-4模型方面的更新:
- gpt4-lite:替換gpt-3.5
- gpt4-auto:一個新的模型端點(endpoint),可自動從網(wǎng)絡(luò)檢索數(shù)據(jù),并集成內(nèi)部數(shù)據(jù)來增強響應(yīng)(不是「搜索引擎」)
- gpt4-lite-auto:與gpt4-auto類似,但使用的是lite版本。
同樣,也有人稱,gpt4-lite即將發(fā)布。
離職OpenAI,入職谷歌的Logan Kilpatrick表示,「6個月后,AI領(lǐng)域的格局將會完全不同。大多數(shù)人會對事情的發(fā)展感到驚訝」。
還有一個疑問是,OpenAI這次會對,gpt2做解釋嗎?
接下來一個月,AI海嘯將翻涌而來。
關(guān)于GPT-5何時面世,最近Altman在All-In Pod中回應(yīng),「我甚至不確定我們是否會命名它為GPT-5」。
他暗示,未來可能不再遵循GPT N+1的發(fā)布模式,而是轉(zhuǎn)向持續(xù)的改進(jìn)過程。
但,GPT-5還得再等等。