
譯者 | 李睿
審校 | 重樓
本文介紹了GPT-5與Gemini 2.5 Pro的巔峰對決,在文本內(nèi)容、圖像生成、互聯(lián)網(wǎng)研究、編程四個方面對這兩種人工智能模型進(jìn)行比較。最終,GPT-5在文本、圖像生成、互聯(lián)網(wǎng)研究對決中勝出,編程平局,以總體優(yōu)勢獲勝,彰顯其作為開創(chuàng)性聊天機(jī)器人的強(qiáng)大實力。
人工智能領(lǐng)域正在迎來一場世紀(jì)級的巔峰對決。兩款功能強(qiáng)大的人工智能模型將進(jìn)行激烈較量,以角逐人工智能模型領(lǐng)域真正的冠軍。一方是OpenAI公司的旗艦產(chǎn)品——GPT-5,其技術(shù)成熟、功能強(qiáng)大且經(jīng)驗豐富;另一方則是谷歌的得意之作——Gemini 2.5 Pro,其運行快速、架構(gòu)高效,并且有望改寫行業(yè)規(guī)則。
自從發(fā)布以來,這兩款大型語言模型在學(xué)術(shù)界、產(chǎn)業(yè)界以及廣大科技愛好者群體中激起了廣泛且深入的討論熱潮。本文將介紹GPT-5和Gemini 2.5 Pro的“巔峰對決”,旨在全方位、深層次地探索這兩種模型在復(fù)雜任務(wù)處理、邏輯推理、知識運用以及創(chuàng)新生成等多維度的綜合實力。
那么,在人工智能領(lǐng)域中,GPT-5和Gemini 2.5 Pro誰將奪冠?
第一輪對決:內(nèi)容(文字)
人工智能模型每天都在通過各類媒介與人類進(jìn)行深度“對話”,它們輸出的內(nèi)容代表著人工智能帶給人類的首批專業(yè)知識成果之一。歷經(jīng)多年的技術(shù)迭代與創(chuàng)新發(fā)展,它們現(xiàn)在比以往任何時候都更詳盡、更有表現(xiàn)力、更細(xì)致入微。
但它們能否應(yīng)對人類專家提出的這一艱巨挑戰(zhàn)呢?現(xiàn)在是揭曉答案的時候了。
提示:
“你好,請撰寫一篇3500字的文章,探討到2030年人工智能可能如何取代人類工作。
請參考以下來源的信息
請標(biāo)明引用該來源信息的確切網(wǎng)址。
確保文章有恰當(dāng)?shù)淖訕?biāo)題劃分。在文章開頭撰寫一段令人關(guān)注且有趣的介紹(最多150字),隨后針對“人工智能的威脅真實存在嗎?”這一標(biāo)題提供支持和反對這一觀點的論據(jù)。
至少包含一節(jié)提到人工智能在未來(2050年)的應(yīng)用,以及可以預(yù)見那時人類與人工智能所做工作的對比?!?/p>
表現(xiàn)
GPT-5輸出


Gemini 2.5 Pro輸出


比分:Gemini 2.5 Pro在第一輪中獲勝
評判這兩個模型的標(biāo)準(zhǔn)如下表所示:
指標(biāo) | GPT-5 | Gemini 2.5 Pro |
字?jǐn)?shù) | 965 | 2163 |
有趣的介紹 | 有 | 有點 |
未來展望 | 有 | 有 |
引人關(guān)注 | 有 | 有 |
耗時 | 瞬時 | 30秒左右 |
實力強(qiáng)勁的Gemini 2.5 Pro擊敗技術(shù)精湛的GPT-5
盡管GPT-5開局不利,生成的字?jǐn)?shù)遠(yuǎn)未達(dá)到指定的字?jǐn)?shù),但其表現(xiàn)迅速反彈,在評判這些表現(xiàn)的4項標(biāo)準(zhǔn)中贏得了2項。GPT-5介紹了一些出色的人工智能文章,并且完全符合提示中的所有細(xì)節(jié)。而且,這一切都以不到5秒的閃電般速度完成。然而,它遠(yuǎn)遠(yuǎn)未達(dá)到指定的字?jǐn)?shù)限制。
另一方面,Gemini 2.5 Pro表現(xiàn)出色,展現(xiàn)了全面的能力,雖然花費的時間更長,但生成文章的長度是GPT-5的兩倍。然而也未達(dá)到指定的字?jǐn)?shù),并且耗時約30秒才給出答案。Gemini 2.5 Pro試圖在介紹段落中發(fā)揮創(chuàng)造性,但與GPT-5的想法相距甚遠(yuǎn)。
GPT-5出現(xiàn)失誤的地方在于,它無法自行從參考鏈接中插入引用內(nèi)容。它沒有這么做,反而給用戶留下了方括號,以便用戶根據(jù)自己的偏好插入引文。如果他們必須自己瀏覽內(nèi)容來添加引用,那么使用人工智能根據(jù)資料源總結(jié)或撰寫內(nèi)容就完全失去了意義。
Gemini 2.5 Pro在這方面則穩(wěn)扎穩(wěn)打,完成了任務(wù)——突出顯示了從來源中選取的區(qū)域/信息。因此獲得滿分10分!但它也有自己的弱點,因此如果不謹(jǐn)慎前行,領(lǐng)先優(yōu)勢可能不會長久。
Gemini 2.5 Pro能否保持領(lǐng)先地位?還是GPT-5會反敗為勝?繼續(xù)關(guān)注。
第二輪對決:圖像生成
在人工智能領(lǐng)域,美感也是智能的一部分,所以首先了解它們生成圖像的能力,并探討這些模型在將提示轉(zhuǎn)化為圖像方面的表現(xiàn)。
提示
“生成一張圖像。
角色——一名25歲左右的印度男子站在交通繁忙的街道邊。他穿著得體,身著米色西裝,但沒有打領(lǐng)帶,襯衫領(lǐng)口敞開。
背景設(shè)置——汽車在寬闊的大街上飛馳,遠(yuǎn)處是一排閃爍著霓虹燈的摩天大樓。最高的建筑的頂部顯示“斯塔克工業(yè)”的標(biāo)志。
動作——他驚訝地看著自己的手,燦爛的火花從手中不斷飛出,并散落在手臂上。他正在發(fā)現(xiàn)自己一直擁有但從未察覺的令人驚訝的超能力?!?/p>
表現(xiàn)
GPT-5輸出

Gemini 2.5 Pro輸出

得分:GPT-5在第二輪對決中獲勝
這兩種模型的評分如下表所示:
指標(biāo) | GPT-5 | Gemini 2.5 Pro |
耗時 | 2分18秒 | 43秒 |
細(xì)節(jié) | 10/10 | 10/10 |
質(zhì)量 | 9/10 | 8/10 |
準(zhǔn)確度 | 10/10 | 8/10 |
表情 | 9/10 | 8/10 |
驚艷程度 | 7/10 | 7/10 |
頗具魅力的Gemini 2.5 Pro敗給沉穩(wěn)的 GPT-5
OpenAI的GPT-5這次巧妙地獲勝。令人驚訝的是,這兩款模型的輸出時間完全顛倒。GPT-5這次花費的時間要長得多,但顯然生成了更加細(xì)膩且視覺上更吸引人的圖像。
從圖像中可以看出,GPT-5生成的圖像質(zhì)量比Gemini 2.5 Pro略勝一籌,這有點令人意外,因為Gemini 2.5 Pro以其圖像生成能力而聞名。它在一些非常細(xì)微的技術(shù)細(xì)節(jié)上有所欠缺,例如提示中明確指出男子應(yīng)該“站在繁忙大街的一側(cè)”,而在其生成的圖像中,男子站在了道路中間。另外,圖像的質(zhì)量也有待提高,男子手中飛濺出的火花并不十分令人印象深刻。說實話,這兩款模型都未能達(dá)到人們對人工智能圖像所期待的“驚艷”程度。
然而,雙方的對決并未結(jié)束。GPT-5已經(jīng)是明確的贏家嗎?或者Gemini 2.5 Pro會卷土重來嗎?讓我們拭目以待。
第三輪對決:互聯(lián)網(wǎng)研究
接下來是迄今為止人工智能模型面臨的最嚴(yán)峻挑戰(zhàn)之一——互聯(lián)網(wǎng)研究??梢哉f是最實際的用例,通過人工智能聊天機(jī)器人進(jìn)行互聯(lián)網(wǎng)研究可以讓創(chuàng)作者從一開始在寫作/文檔方面占據(jù)優(yōu)勢。以下將見證哪款人工智能模型更出色。
提示
“提供10個具有高度可信度的網(wǎng)站文章/博客/研究來源——這些來源討論了地球空心論其可能性?!?/p>
表現(xiàn)
GPT-5輸出


Gemini 2.5 Pro輸出



得分:GPT-5在第三輪對決中勝出
評判這兩個模型的四個標(biāo)準(zhǔn)如下表所示:
指標(biāo) | GPT-5 | Gemini 2.5 Pro |
耗時 | <10秒 | 32秒 |
準(zhǔn)確度 | 完全準(zhǔn)確 | 非常好 |
來源質(zhì)量 | 卓越 | 良好 |
失誤 | 無 | 未提供鏈接 |
GPT-5輕松領(lǐng)先
GPT-5似乎很熟練,它以閃電般的速度給出了完全準(zhǔn)確且來源質(zhì)量極高的鏈接。
Gemini 2.5 Pro也進(jìn)行了有力的反擊,提供了同樣出色的相關(guān)主題文章來源,甚至分享了一個關(guān)于該主題的詳細(xì)YouTube視頻。然而,它生成的速度太慢,耗時是GPT-5的三倍。此外,它犯了一個大錯,因此導(dǎo)致失敗——Gemini 2.5 Pro沒有分享任何來源的可點擊鏈接。那么,Gemini 2.5 Pro是缺乏必要的才能,還是缺乏基本常識,需要用戶自己判斷。
另一方面,GPT-5分享了來自知名出版物的高質(zhì)量內(nèi)容來源的可點擊鏈接。它進(jìn)一步以易于理解的表格形式總結(jié)了其研究結(jié)果。它甚至給出了一個總體結(jié)論,即沒有文獻(xiàn)支持“地球空心論”,但對此進(jìn)行了詳細(xì)解釋。它做得非常到位,而且這些額外的步驟使它成為了這一輪對決的贏家。
到目前為止,GPT-5處于領(lǐng)先地位,Gemini 2.5 Pro除了全力以赴外別無選擇。GPT-5會再贏嗎?以下將揭曉答案。
第四輪對決:編程
在人工智能模型的終極對決中,它們的編程技能將接受考驗。需要注意的是,這兩款模型的編程能力都比它們的上一代有所增強(qiáng)。但這種進(jìn)化是否足以擊敗競爭對手呢?以下是面臨的挑戰(zhàn):
提示
“編寫有關(guān)機(jī)器學(xué)習(xí)和人工智能主題的博客網(wǎng)站的HTML代碼。網(wǎng)站首頁的第一個部分應(yīng)該有一個輪播圖,其中主要新聞放在一個大框中,旁邊是四個其他主要新聞的小縮略圖列表。無論點擊哪個框,它都會擴(kuò)展成主要新聞的大框。之前的主要新聞故事會移到一側(cè),取代那個小縮略圖的位置。
接下來再制作兩個部分:一個是包含10條新聞故事的橫向滾動列表;另一個是將6個新聞故事分成兩列,每列有3個縮略圖。在頁面底部添加一個展示常見元素的頁腳,例如‘關(guān)于我們’、‘聯(lián)系我們’等。
再制作一個名為‘分享作品’的頁面。該頁面應(yīng)有兩行文字,呼吁讀者分享他們的作品。接下來,設(shè)置一個聯(lián)系表單,包含以下字段——姓名、電子郵件和作品。對作品條目設(shè)置500字的字?jǐn)?shù)限制。
網(wǎng)站的主題應(yīng)為藍(lán)色、白色和橙色的混合。確保它盡可能吸引人。必須在頁眉空間的中間位置放置一個logo。自己制作一個logo?!?/p>
表現(xiàn)
GPT-5輸出



Gemini 2.5 Pro輸出




得分:平局!
首先來看一下雙方的記分牌。
指標(biāo) | GPT-5 | Gemini 2.5 Pro |
耗時 | 3分30秒 | 不到2分鐘 |
準(zhǔn)確度 | 10/10 | 10/10 |
視覺吸引力 | 7/10 | 9/10 |
功能性 | 10/10 | 8/10 (未提供可下載文件) |
創(chuàng)造性 | 9/10 | 9/10 |
Gemini 2.5 Pro開局強(qiáng)勢但后勁不足
在這一輪對決中,這兩款人工智能模型的表現(xiàn)都非常出色,生成了非常準(zhǔn)確的結(jié)果,所有的細(xì)節(jié)都像提示中提到的那樣。網(wǎng)站設(shè)計整潔、用戶友好且功能齊全,每個元素都包含了必要的細(xì)節(jié)。所有部分也都按照給定的提示制作并正常工作。然而,這兩種模型在某些時候互有勝負(fù)。
例如,Gemini 2.5 Pro的結(jié)果生成的太快了,在提示給出后不到2分鐘內(nèi)就生成了整個代碼。它甚至生成的網(wǎng)站外觀比另外兩個結(jié)果更好看,具有專業(yè)博客應(yīng)有的外觀和感覺。然而,由于設(shè)計是一件主觀的事情,所以難以在這方面對兩種輸出結(jié)果進(jìn)行過多區(qū)分。
盡管Gemini 2.5 Pro開局強(qiáng)勢,但在另一個重要方面再次落后于GPT-5。GPT-5能夠以可下載文件夾的格式分享整個代碼??梢暂p松下載它并運行代碼來檢查網(wǎng)站。而Gemini 2.5 Pro則無法提供任何這樣的文件夾,即使是在特別要求的情況下。然后,開發(fā)人員不得不手動在文件夾中創(chuàng)建新文本文件、復(fù)制/粘貼代碼,然后運行它們。因此實用性受到了影響。
隨著這一輪對決的結(jié)束,獲勝者已經(jīng)顯而易見。
結(jié)論:GPT-5獲勝!
在這場激烈的人工智能模型的對決中,Gemini 2.5 Pro和GPT-5都證明了自己的非凡實力。它們以快速的反應(yīng)速度、精準(zhǔn)的應(yīng)答能力,在各類實際應(yīng)用場景中大放異彩。然而,GPT-5似乎仍略勝一籌。畢竟,它是全球首個以這一形式進(jìn)入大眾視野的人工智能聊天機(jī)器人,具有開創(chuàng)性意義。
在人工智能工具與服務(wù)的興起之初,眾多模型如雨后春筍般涌現(xiàn)(例如Midjourney),但時至今日,大多數(shù)都如過眼云煙。但ChatGPT并非如此,它憑借持續(xù)不斷的迭代升級,為其廣受歡迎的聊天機(jī)器人注入新活力(正如GPT-5所展現(xiàn)的那樣),并添加塑造人工智能技術(shù)前沿的服務(wù)(例如Codex和GPTs),ChatGPT確保了自己的領(lǐng)先地位。

原文標(biāo)題:GPT-5 vs Gemini 2.5 Pro: The Champion AI is…,作者:Sarthak Dogra
































