ChatGPT實測全線碾壓Bard!谷歌潰敗,十年心血打水漂
OpenAI的ChatGPT火了以后,著實是讓生成式AI名聲大噪。
與此同時,Google也不甘下風,也有個叫Bard的AI助手。
但這個Bard怎么說呢,不太好用。
國外小哥Michael King使用了搭載GPT-3.5和GPT-4的ChatGPT與Google的Bard,并進行了深度測評。
結(jié)果令人感到震驚。
King總結(jié)了兩種AI的優(yōu)點、不足和各自顯得奇怪的地方。
要知道,Google在Bard身上可是投了大手筆——整整研發(fā)了十年。然而最終的成果和這十年的投入相比,好像顯得有點不值當。
先來道數(shù)學題
首先是邏輯和數(shù)學方面。
小哥給兩種AI提了一個相同的問題:
小明6歲那年,他的妹妹是他年齡的一半,同時他媽媽的年齡是他妹妹的10倍。今年小明60歲,那么他媽媽今年多少歲?
讀者朋友可以活動一下腦筋,自己先來看看能不能很快算出來。
從AI的生成結(jié)果來看,Bard可算得不對。
整個分析過程出現(xiàn)了很匪夷所思的錯誤,Bard連小明和他媽媽的年齡差都沒算出來,就直接在60上加了個30。
而無論是GPT-3.5還是GPT-4,算出來的答案都是正確的。用媽媽30歲的年齡減去小明6歲的年齡,首先算出年齡差再在60歲上加一個24,得出媽媽今年84歲。
GPT-3.5:
GPT-4:
第一關(guān)Bard就沒過去。目前比分1:0,ChatGPT暫時領(lǐng)先。
說唱歌曲創(chuàng)作PK
第二關(guān)是文學領(lǐng)域的挑戰(zhàn)。
小哥讓兩種AI都來寫一首有關(guān)泰坦尼克號、相對論、卡戴珊的說唱歌曲,并且要用Eminem的唱法。
我們先來看看Bard的作品:
上下滑動查看全部
我們甚至不用看每句歌詞的含義,大概讀一遍就能發(fā)現(xiàn),沒什么節(jié)奏和韻律可言。
每句話都非常長,不像是說唱歌曲,倒像是一篇云里霧里的小作文。
再來看看GPT-3.5的杰作:
讀一遍就能發(fā)現(xiàn),每句長短恰到好處,韻也押的不錯。
甚至還有結(jié)合了三個主題的副歌部分,堪稱專業(yè)。熟悉姆爺唱法的朋友,還真能從里面找出姆爺?shù)哪欠N節(jié)奏感和風格。
小哥表示GPT-3.5的作品還不錯,他認為GPT-4能做得更好。
小編對英語說唱了解的不多,但估計做測評的小哥是個說唱發(fā)燒友。他認為GPT-4的作品非常炸裂,ChatGPT是當之無愧的AI屆說唱之王。
其實朋友們倒也不用多懂說唱,這三段詞放一起,想必就算是像我一樣的音樂盲,心里都有個高下比較。
目前比分2:0。
講講笑話看看呢?
小哥接下來又讓兩種AI講個有關(guān)NASA、壽司和特朗普的笑話。
Bard:
「NASA打算往火星寄一卷壽司,他們想看看壽司到了火星上還新不新鮮。這卷壽司被放在一個特殊的容器里,這樣就可以保持一個合適的溫度。同時,NASA還往里放了一個計時器,這樣就能知道什么時候能吃這個壽司了。
這卷壽司終于降落在了火星上,而且還是新鮮的。NASA的科學家們都感到很驚奇。他們決定下一步把特朗普牛排也送到火星上去。
特朗普牛排被放在一個同樣的容器里,容器里也有一個計時器。
然而特朗普牛排在到了火星以后變得不新鮮了。NASA的科學家們感到非常失望,他們打算給特朗普本人發(fā)一封信,解釋一下發(fā)生了什么。
信里寫道:親愛的特朗普,我們送了一塊你的牛排到火星上去,但是不新鮮了。我們覺得原因可能是因為你的表現(xiàn)問題。你老是在吹噓你有多厲害,老是侮辱別人。我們覺得這是你的牛排變質(zhì)的原因。為此造成的不便,我們很抱歉?!?/span>
咱也不知道是不是有些美式幽默沒get到,但看完是真不想笑。不過測評小哥也表示,確實沒懂。那小編就放心了,確實寫的不行。
GPT-3.5:
「NASA把一個壽司大廚送到了太空,打算給特朗普做一個特殊的壽司卷。當大廚問特朗普他喜不喜歡的時候,特朗普說:還可以,但你能再多加點空間嗎?」
這里的中譯版本沒那味兒了,其實是用了一個space的雙關(guān)。原文如下:
測評小哥表示,還可以,但也就是還可以了。
GPT-4:
「為什么NASA要邀請?zhí)乩势蘸鸵粋€壽司大廚去參與他們的太空項目?因為NASA需要有人來應付變化,并且確保任務不夾生!」
照例把原版放在這里:
小哥表示,這個也一般,但punchline還不錯。
這一局ChatGPT的發(fā)揮也有些失常,給它算0.5分。
程序Debug?
這一局更專業(yè)了——給程序Debug。
小哥輸入了一段Python程序,讓兩種AI分別Debug。
Bard:
這Debug的可不咋樣,小哥戲謔地表示,Bard回學校重修去吧!
GPT-3.5:
GPT-3.5指出,如果輸入集是空的,那就會出現(xiàn)ZeroDivisionError,而為了避免這種錯誤的出現(xiàn),可以在前面加一個檢查的步驟,如果輸入集是空的,那么就直接輸出0,而不顯示錯誤。
小哥表示,完美地Debug。
GPT-4:
GPT-4指出了和GPT-3.5所指出一樣的錯誤,并且提供了同樣的解決辦法。
這一局ChatGPT又贏了。
Bard?差太多了!
從測評的結(jié)果看,和ChatGPT相比,谷歌Bard的表現(xiàn)可謂是讓人失望至極。和GPT-3.5的能力都差的遠,更不用說GPT-4了。
谷歌的未來顯然有賴于Bard的成功,但是Bard的發(fā)展顯然沒有跟上競爭對手OpenAI的步伐。
從另一方面來說,微軟收購了OpenAI的大量股份這一舉動非常聰明。確保了其在AI未來十年發(fā)展的領(lǐng)導地位。
但是,如果谷歌不努力提升Bard的性能來和GPT一決高下,谷歌可能就會是那個慘遭淘汰的了。