AI學(xué)術(shù)算命?Gemini 2.0預(yù)測(cè)谷歌AI大佬職業(yè)生涯,準(zhǔn)到離譜!
如果讓人工智能來(lái)點(diǎn)評(píng)博士論文,還順手預(yù)測(cè)一下作者將來(lái)的職業(yè)發(fā)展。會(huì)是什么樣子?
最近,谷歌首席科學(xué)家、Gemini負(fù)責(zé)人Jeff Dean就玩了這么一出,他把自己的博士論文交給了最新的Gemini 2.0。
結(jié)果,這位AI「批評(píng)家」只花了26秒,就給出了一份相當(dāng)深刻的剖析報(bào)告。

Jeff Dean用最新的Gemini 2.0 Flash Thinking Experimental 01-21分析了自己的博士論文《面向?qū)ο笳Z(yǔ)言的完整程序優(yōu)化》——一篇長(zhǎng)達(dá)134,540個(gè)Token的大作。
他給Gemini的提示詞非常簡(jiǎn)潔,就一句:「Please analyze this PhD thesis and give me a concise critique of things that could be improved」。(請(qǐng)分析這份博士論文,并就其可以改進(jìn)之處給出一個(gè)簡(jiǎn)明的評(píng)價(jià))
結(jié)果,Gemini在短短26秒內(nèi)「火力全開(kāi)」,給出了論文不足和改進(jìn)之處的精準(zhǔn)點(diǎn)評(píng)。

緊接著,DeepMind高級(jí)研究科學(xué)家Yi Tay也跟風(fēng)測(cè)試,將自己長(zhǎng)達(dá)205K個(gè)Token的博士論文《用于自然語(yǔ)言理解的神經(jīng)架構(gòu)》丟給了Gemini。
得到的評(píng)價(jià)同樣「刀刀見(jiàn)血」,連論文作者本人都承認(rèn)點(diǎn)評(píng)得確實(shí)到位。

兩位大佬的論文在Gemini眼里,都「問(wèn)題」不少。
Jeff Dean的論文被指出「需要更多理論基礎(chǔ)」、「存在擴(kuò)展性問(wèn)題」以及「離線分析數(shù)據(jù)不穩(wěn)定」,甚至連簡(jiǎn)歷里一句「可樂(lè)癮還挺大的,是吧?」都被AI捕捉到,并調(diào)侃了一番。
而Yi Tay的論文則被吐槽「幾乎沒(méi)有理論貢獻(xiàn)」、「整體敘事結(jié)構(gòu)松散」、「對(duì)模型效率的定義也不夠嚴(yán)謹(jǐn)」,以及「缺乏深入分析,就知道搞基準(zhǔn)測(cè)試」。
這評(píng)價(jià),比他的博士導(dǎo)師還要「毒舌」。
就連Yi Tay自己也承認(rèn),Gemini的評(píng)價(jià)「確實(shí)如此,比我的博士導(dǎo)師靠譜多了」。
更令人驚奇的是,Gemini不僅能點(diǎn)評(píng)論文,還能「預(yù)測(cè)」職業(yè)規(guī)劃。

基于Jeff Dean的論文,Gemini推斷他「最有可能且成功的路徑」是進(jìn)入行業(yè)研究實(shí)驗(yàn)室(例如,谷歌研究、微軟研究、IBM 研究),或者成為大型科技公司(例如,谷歌、Facebook、亞馬遜)的軟件工程領(lǐng)導(dǎo)/技術(shù)專(zhuān)家。
事實(shí)呢?
Jeff Dean的職業(yè)軌跡完美契合了Gemini的預(yù)測(cè),他早期加入谷歌,并成為那里最有影響力的工程師之一,為MapReduce、BigTable和TensorFlow等基礎(chǔ)技術(shù)做出了貢獻(xiàn)。
無(wú)獨(dú)有偶,谷歌DeepMind研究副總裁及深度學(xué)習(xí)負(fù)責(zé)人、Gemini聯(lián)合負(fù)責(zé)人Oriol Vinyals也讓Gemini預(yù)測(cè)了他的職業(yè)發(fā)展,結(jié)果也相當(dāng)準(zhǔn)確。

那么問(wèn)題來(lái)了,Gemini的精準(zhǔn)預(yù)測(cè)究竟是巧合,還是AI的又一次進(jìn)化?難道AI真的能成為學(xué)術(shù)界的「算命先生」,替學(xué)術(shù)界的年輕人指點(diǎn)迷津?

Gemini的深度解析能力與預(yù)判
Gemini的表現(xiàn)并不是簡(jiǎn)單用關(guān)鍵詞匹配或模板套用就能解釋得通的。它的背后,是強(qiáng)大的深度解析能力和對(duì)自然語(yǔ)言的深入理解。
以其最新版本2.0 Flash為例,它建立在1.5 Flash的成功之上,是開(kāi)發(fā)人員迄今為止最受歡迎的模型,以同樣快的響應(yīng)時(shí)間的同時(shí)增強(qiáng)了性能。
值得注意的是,在關(guān)鍵的基準(zhǔn)測(cè)試中,2.0 Flash甚至優(yōu)于1.5 Pro,而速度卻是后者的兩倍。
2.0 Flash還具有新功能。除了支持圖像、視頻和音頻等多模態(tài)輸入外,2.0 Flash現(xiàn)在還支持多模態(tài)輸出,如原生生成的圖像與文本和可控文本到語(yǔ)音(TTS)多語(yǔ)言音頻混合。
它還可以本地調(diào)用工具,如谷歌搜索、代碼執(zhí)行以及第三方用戶定義的函數(shù)。

Gemini的洞察力體現(xiàn)在哪里
在Jeff Dean的案例里,Gemini的表現(xiàn)讓人感覺(jué)它像個(gè)能洞悉一切的高手。

它先是非常犀利地指出論文里一些難以察覺(jué)的弱點(diǎn),比如理論基礎(chǔ)不牢、擴(kuò)展性有瓶頸、離線分析數(shù)據(jù)也不夠穩(wěn)定。就連那些資歷深厚的研究者,有時(shí)都會(huì)忽略這些細(xì)節(jié)。
接著,Gemini還給了一個(gè)思路——可以考慮混合鏈接時(shí)間和全程序編譯的方式,這讓Jeff Dean后續(xù)的研究方向更清晰。
更有意思的是,Gemini能讀懂作者在簡(jiǎn)歷里那些看似隨意的口吻,還忍不住調(diào)侃了幾句,這種精準(zhǔn)捕捉語(yǔ)言細(xì)節(jié)的能力,展現(xiàn)出它對(duì)自然語(yǔ)言的深刻理解。
整體看下來(lái),Gemini的這種「火眼金睛」確實(shí)讓人驚嘆。


Yi Tay:Gemini的評(píng)價(jià)非常準(zhǔn)確
Yi Tay的論文里動(dòng)手能力超強(qiáng),各種實(shí)驗(yàn)做得飛起,數(shù)據(jù)也是一大堆。但是有點(diǎn)光顧著展示酷炫的技巧,卻忘了講背后的原理。
這在深度學(xué)習(xí)剛興起那會(huì)兒,也算是正常,畢竟那時(shí)大家都忙著「搭房子」,還沒(méi)空好好研究「地基」。
再說(shuō)說(shuō)論文的排版。Yi Tay這篇論文,是把好幾篇小論文拼湊在一起的,就像是用不同的積木搭了個(gè)城堡,雖然看起來(lái)也挺像那么回事,但仔細(xì)一看,連接的地方還是有點(diǎn)生硬,不夠流暢。
Gemini一眼就看出了這個(gè)問(wèn)題,真是「火眼金睛」。
最后,不得不提的是「基準(zhǔn)測(cè)試」。
當(dāng)時(shí),大家都很熱衷于刷紀(jì)錄,就像游戲里沖排行榜一樣。研究者們喜歡在各種測(cè)試集上比拼分?jǐn)?shù),分?jǐn)?shù)高誰(shuí)就厲害,反而忽略了模型本身的內(nèi)在邏輯和原理。
Gemini毫不客氣地吐槽了當(dāng)時(shí)學(xué)術(shù)圈的這個(gè)怪現(xiàn)象!

AI預(yù)測(cè):巧合還是趨勢(shì)
Jeff Dean和 Oriol Vinyals的現(xiàn)實(shí)職業(yè)軌跡都驗(yàn)證了Gemini的預(yù)測(cè),這無(wú)疑增強(qiáng)了其預(yù)測(cè)的可信度。
再結(jié)合Gemini對(duì)Yi Tay等其他研究者論文的準(zhǔn)確評(píng)價(jià),可以認(rèn)為,Gemini的預(yù)測(cè)并非簡(jiǎn)單的巧合,而是基于對(duì)學(xué)術(shù)研究和行業(yè)趨勢(shì)的深刻理解。
Gemini能精準(zhǔn)捕捉研究者的學(xué)術(shù)風(fēng)格和潛在缺陷,離不開(kāi)對(duì)海量學(xué)術(shù)論文的訓(xùn)練。
職業(yè)預(yù)測(cè)時(shí),Gemini會(huì)從論文中挖掘作者的硬技能和軟技能,并結(jié)合學(xué)術(shù)界和工業(yè)界的熱門(mén)領(lǐng)域,比如高并發(fā)性能調(diào)優(yōu)、大規(guī)模語(yǔ)言模型研發(fā)、跨模態(tài)深度學(xué)習(xí)等,評(píng)估作者與這些方向之間可能發(fā)生的化學(xué)反應(yīng)。
它對(duì)各大科技巨頭的研究動(dòng)向相當(dāng)熟悉,哪些團(tuán)隊(duì)在鉆研編譯器與程序優(yōu)化,哪些團(tuán)隊(duì)專(zhuān)注于大模型,一清二楚,所以能夠更準(zhǔn)確地推測(cè)作者在哪個(gè)方向或崗位會(huì)大放異彩。
不過(guò),AI的預(yù)測(cè)固然強(qiáng)大,卻并不意味著它無(wú)所不能。
個(gè)人的興趣、價(jià)值觀和人生目標(biāo),往往帶有高度的主觀性,AI很難全面掌握。
人生里還有各種機(jī)遇和挑戰(zhàn),時(shí)不時(shí)冒出來(lái)的偶然事件,也超出AI的范圍。
Gemini是「馬后炮」嗎?
不過(guò),很快就有網(wǎng)友質(zhì)疑Gemini是否提前知道Jeff Dean的職業(yè)生涯,所以才給出如此準(zhǔn)確的預(yù)測(cè),認(rèn)為這是一種「劇透」或「馬后炮」。
確實(shí),作為AI大佬,Jeff Dean的信息在互聯(lián)網(wǎng)上遍地都是,Gemini從中獲得這些信息并不奇怪。


但就算如此,能把他的論文內(nèi)容跟后來(lái)的職業(yè)道路對(duì)應(yīng)起來(lái),也說(shuō)明它有一套「讀懂」和「聯(lián)想」的本事。
況且,Gemini對(duì)Oriol Vinyals和Yi Tay等人的分析同樣精準(zhǔn),也說(shuō)明并不僅僅是「馬后炮」。
AI與學(xué)術(shù)的未來(lái)
Gemini的出現(xiàn),為學(xué)術(shù)界帶來(lái)了無(wú)限的想象空間??梢灶A(yù)見(jiàn),Gemini將成為科研人員的得力助手,極大地提高科研效率,輔助學(xué)術(shù)創(chuàng)新。
文獻(xiàn)綜述可以交給它,在海量論文里檢索、歸類(lèi)并提供初步解讀,讓研究者更快獲取新鮮信息。實(shí)驗(yàn)設(shè)計(jì)也能借它的力量,根據(jù)研究目標(biāo)和已有文獻(xiàn)來(lái)制定更科學(xué)的實(shí)驗(yàn)方案和評(píng)估指標(biāo)。
論文的潤(rùn)色與審校更是不在話下,從語(yǔ)法到邏輯結(jié)構(gòu),隨時(shí)提供修改建議,就像一個(gè)隨叫隨到的「科研小秘書(shū)」。
面對(duì)不斷升級(jí)的AI工具,我們應(yīng)當(dāng)思考:除了「點(diǎn)評(píng)論文」與「預(yù)測(cè)職業(yè)」,AI是否還能為學(xué)術(shù)研究帶來(lái)更深層次的革新?
有人把它當(dāng)成萬(wàn)能搜索引擎或?qū)懽鳈C(jī)器,「拿來(lái)主義」似乎一勞永逸。事實(shí)上,真正優(yōu)秀的學(xué)術(shù)工作者應(yīng)該在使用這些工具時(shí)保持清醒,批判性思維和獨(dú)立創(chuàng)新一直都是科研的靈魂。
離開(kāi)了人類(lèi)學(xué)者的洞察與創(chuàng)造,AI 再?gòu)?qiáng)也只能在已有知識(shí)的范疇里打轉(zhuǎn)。真正的前沿、那些從未踏足的「未知之地」,依舊需要人類(lèi)去開(kāi)拓。
























