谷歌劈柴立軍令狀:必?cái)豋penAI,奪回第一!
2025年還未開始,硅谷的戰(zhàn)鼓已經(jīng)擂響。
在這場(chǎng)AI巨頭之間的角力中,谷歌CEO劈柴放出了一記重磅炸彈。
在谷歌山景城總部舉行的年度戰(zhàn)略會(huì)議上,身著節(jié)日毛衣的劈柴語(yǔ)氣凝重地對(duì)員工們說(shuō)道——
2025年將是關(guān)鍵的一年!
我們必須認(rèn)識(shí)到當(dāng)下時(shí)刻的緊迫性,公司需要以更快的速度前進(jìn)。這是一個(gè)顛覆性時(shí)刻,賭注從未如此之高。
這番話背后,是谷歌與微軟OpenAI之間愈演愈烈的較量。
自ChatGPT橫空出世以來(lái),這家搜索引擎巨頭一直在努力追趕。過(guò)去兩年,谷歌的努力幾乎總被愛搶風(fēng)頭的OpenAI蓋了過(guò)去。
直到12月,Gemini 2.0 Flash、Veo 2、「谷歌版o1」Gemini 2.0 Flash Thinking等輪番轟炸,一展超越領(lǐng)先模型的潛力。僅用了90天的時(shí)間,谷歌終于逆風(fēng)翻盤。
這意味著,這場(chǎng)AI競(jìng)賽終于迎來(lái)了轉(zhuǎn)折點(diǎn)。
會(huì)議現(xiàn)場(chǎng),劈柴展示了一張大模型的對(duì)比圖,Gemini 1.5傲然領(lǐng)先于OpenAI等其他競(jìng)爭(zhēng)對(duì)手的模型。
當(dāng)被問及ChatGPT正成為AI的代名詞時(shí),劈柴坦言道,「在歷史場(chǎng)長(zhǎng)河中,你不必總是第一個(gè),但必須出類拔萃,必須在同類產(chǎn)品中保持第一梯隊(duì)。這就是2025年的意義所在」。
谷歌開發(fā)者關(guān)系負(fù)責(zé)人Logan Kilpatrick多次暗示,明年谷歌真的要發(fā)力了。
——預(yù)計(jì)1月份的目標(biāo),完整版Gemini 2.0正式上線。
甚至,在谷歌DeepMind CEO Hassabis年度總結(jié)下面,他稱這些都只是開胃菜,好戲?qū)⒃?025年開始。
有網(wǎng)友預(yù)測(cè)道,明年谷歌將會(huì)把很多強(qiáng)大模型免費(fèi)推向所有人,而且還會(huì)發(fā)布直擊o3的競(jìng)爭(zhēng)模型。
為了在這場(chǎng)AI革命中占據(jù)制高點(diǎn),谷歌正全力以赴。
Gemini,下一個(gè)5億級(jí)用戶爆款應(yīng)用
對(duì)谷歌而言, 可能更糟糕的是競(jìng)爭(zhēng)對(duì)手OpenAI在搜索業(yè)務(wù)的挑戰(zhàn)。
雖然谷歌仍主導(dǎo)搜索市場(chǎng),但GenAI為人們提供了各種訪問在線信息的新方式。
而OpenAI正在被更多人看作是AI的代名詞,如同國(guó)外把谷歌看作搜索的代名詞一樣。
谷歌背負(fù)著巨大的壓力,正通過(guò)重金投資Gemini,來(lái)鞏固期在AI領(lǐng)域的領(lǐng)先優(yōu)勢(shì)。
Gemini應(yīng)用程序允許用戶訪問許多工具,包括谷歌的聊天機(jī)器人。
劈柴表示,「建立大型新業(yè)務(wù)」是重中之重。
谷歌目前擁有15個(gè)用戶超過(guò)五億的應(yīng)用, 而高管們普遍認(rèn)為Gemini應(yīng)用將是下一個(gè)。
劈柴認(rèn)為Gemini應(yīng)用具有「強(qiáng)勁勢(shì)頭」,但也不得不承認(rèn)「在2025年還有一些工作要做,以縮小差距并建立領(lǐng)導(dǎo)地位」。
劈柴后來(lái)補(bǔ)充道:「明年最大的重點(diǎn)是在消費(fèi)者方面擴(kuò)展Gemini?!?/span>
此外, 谷歌在美國(guó)還被法律纏身,包括其在壟斷搜索的法律裁定,以及非法主導(dǎo)在線廣告技術(shù)的指控。
英國(guó)監(jiān)管機(jī)構(gòu)則暫時(shí)認(rèn)定谷歌的廣告技術(shù)行為影響了該國(guó)的競(jìng)爭(zhēng)力。
對(duì)此,劈柴表示:「這是我們的規(guī)模和成功所帶來(lái)的。這是科技正在大規(guī)模影響社會(huì)的大趨勢(shì)的一部分。因此,此時(shí)此刻,我們要比以往任何時(shí)刻都要確保自己不會(huì)分心?!?/span>
谷歌,「后來(lái)者」居上?
OpenRouterAI的數(shù)據(jù)顯示,谷歌旗下的Gemini在開發(fā)者中的市場(chǎng)份額從9月份的約5%,直接飆升至>50%市場(chǎng)份額,遙遙領(lǐng)先,連帶股價(jià)也上漲了14%。
而此時(shí),距離OpenAI發(fā)布ChatGPT的2022年11月30日,已經(jīng)整整過(guò)去了2年。
早在2017年,Sam Altman在一次郵件交流中就明確表示,谷歌DeepMind是在AGI競(jìng)爭(zhēng)中最強(qiáng)大的對(duì)手,但令他沒想到的是,曾經(jīng)公認(rèn)的「AI巨頭」谷歌卻是個(gè)「花架子」。
ChatGPT發(fā)布以來(lái),幾乎成了「AI的代名詞」,不僅迅速征服了市場(chǎng),還連帶著微軟起飛,在Edge瀏覽器中嵌入Copilot AI搜索助手,直接斷崖式領(lǐng)先。
被寄予厚望的谷歌,反倒是昏招頻出,先是Bard難產(chǎn),又經(jīng)歷AI Overview總結(jié)能力大翻車,建議孕婦吸煙、自殺跳橋等等。
在AI順風(fēng)車下,股價(jià)不漲反降,谷歌一時(shí)間淪為笑柄,被OpenAI打的毫無(wú)還手之力,更準(zhǔn)確的說(shuō),連同臺(tái)競(jìng)技的資格都沒有。
讓人費(fèi)解的是,谷歌和DeepMind擁有世界上最好的硬件、最多的訓(xùn)練數(shù)據(jù)、最頂尖的人才,也發(fā)過(guò)很多具有劃時(shí)代意義的論文,如AlphaFold、GenCast等,但為什么就連Anthropic這樣的創(chuàng)業(yè)公司都打不過(guò)?
網(wǎng)友分析的細(xì)節(jié)原因不勝枚舉,一句話來(lái)說(shuō),就是「船大難掉頭」。
從安全性上考慮,谷歌作為世界級(jí)獨(dú)一檔的科技巨頭,不論發(fā)布什么產(chǎn)品,其用戶群體都不會(huì)小,會(huì)涉及到各個(gè)種族、不同的意識(shí)形態(tài),一點(diǎn)小問題就會(huì)被無(wú)限放大,而文本生成又是非常主觀的,很容易受到訓(xùn)練材料的偏見影響,所以谷歌需要更長(zhǎng)的時(shí)間進(jìn)行合規(guī)檢查。
23年初,谷歌受輿論裹挾,急急忙忙發(fā)布Bard,在發(fā)布會(huì)上關(guān)于問題「關(guān)于詹姆斯·韋伯太空望遠(yuǎn)鏡,我可以告訴我9歲的孩子它有哪些新發(fā)現(xiàn)?」,Bard給出錯(cuò)誤答案。
這直接導(dǎo)致公司股價(jià)暴跌8%,市值縮水1000多億美元,讓投資群體和用戶大失所望。
但其實(shí)OpenAI的產(chǎn)品也經(jīng)常胡說(shuō)八道、張冠李戴,不過(guò)因?yàn)槭莿?chuàng)業(yè)公司,所以大眾的容忍度會(huì)高很多,產(chǎn)品標(biāo)注為beta測(cè)試,還可以不斷迭代修改。
作為大公司的谷歌,也受到更多法律上的限制,比如用戶數(shù)據(jù)的版權(quán)問題。
谷歌曾因在AI訓(xùn)練過(guò)程中違反歐盟版權(quán)法被罰款2.5億歐元,也是全球首個(gè)因AI訓(xùn)練數(shù)據(jù)被罰款的案例,坐擁金山,卻無(wú)法使用,無(wú)異于自斷雙臂。
谷歌的產(chǎn)品線龐大,想要在所有產(chǎn)品中都加入AI驅(qū)動(dòng),需要非常細(xì)致的產(chǎn)品管理能力,而去年末發(fā)布的Gemini 1.0,因其過(guò)度「多樣化」的策略,再次導(dǎo)致股價(jià)下跌。
不過(guò),「成功者說(shuō)什么都是對(duì)的」,谷歌重新以王者之姿橫掃AI,未來(lái)還計(jì)劃繼續(xù)引領(lǐng)「智能體」發(fā)展,攜手瀏覽器和手機(jī)端,全自動(dòng)實(shí)現(xiàn)用戶任務(wù)。
谷歌年度AI大事件
谷歌并非沒有看到AI市場(chǎng)的巨大潛力, 但2024年才算是開始「發(fā)力」的一年。
很多有名氣的產(chǎn)品基本都是在今年發(fā)布的,比如各種版本的Gemini,NotebookLM,Pixel手機(jī)上的AI功能等等。
傳送門:https://blog.google/technology/ai/google-ai-news-recap-2024/
谷歌宣稱在2024年有「60條重大AI發(fā)布」, 不妨看看其中幾條主要的基礎(chǔ)能力。
Gemini模型
去年12月,谷歌推出首個(gè)原生多模態(tài)模型Gemini 1.0,打響了谷歌的AI反擊戰(zhàn)。
它可以同時(shí)處理文本、視頻、圖像、音頻和代碼等數(shù)據(jù),結(jié)合了包括數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理在內(nèi)的 57 個(gè)學(xué)科,也是第一個(gè)在MMLU(大規(guī)模多任務(wù)語(yǔ)言理解)基準(zhǔn)上超越人類專家的模型。
今年2月,谷歌將Gemini 升級(jí)到1.5,把上下文窗口從32k提升到100萬(wàn)個(gè)token,超越了同時(shí)期所有大模型。
在推理性能上也有大幅提升,Bard也正式更名為Gemini
7月,免費(fèi)版Gemini 1.5 Flash發(fā)布,支持40多種語(yǔ)言,覆蓋230多個(gè)國(guó)家和地區(qū),質(zhì)量和延遲都有大幅提升,尤其是在推理和圖像理解方面。
12月推出的Gemini 2.0 Flash集成了多模態(tài)和原生工具使用能力,標(biāo)志著大模型正式邁入「智能體」時(shí)代。
基于Gemini 2.0, 谷歌構(gòu)建了原型項(xiàng)目Mariner,從瀏覽器出發(fā)探索全新的人機(jī)交互方式:訓(xùn)練Gemini來(lái)理解并推理瀏覽器屏幕上的信息,包括像素和文本、代碼、圖像和表單等元素,然后通過(guò)實(shí)驗(yàn)性的Chrome擴(kuò)展程序自主完成復(fù)雜任務(wù)。
在產(chǎn)品方面,谷歌于今年5月基于Gemini推出Ask Photos功能,用戶可以通過(guò)輸入關(guān)鍵詞,如地點(diǎn)、人物和日期,或是類似「主題生日派對(duì)」等自然語(yǔ)言概念對(duì)照片庫(kù)進(jìn)行檢索。
NotebookLM
去年7月,谷歌推出了一款A(yù)I驅(qū)動(dòng)的科研和寫作助手NotebookLM。
一年后,其底層模型切換為Gemini 1.5 Pro,用戶可以上傳研究筆記、訪談?dòng)涗浕蚬疚募?,然后提出相關(guān)問題以理解和探索復(fù)雜材料,支持幻燈片、pdf等多種格式。
9月,NotebookLM發(fā)布重磅Audio Overview功能,模型可以針對(duì)用戶材料生成兩位AI主持人互相討論的音頻,可以幫助用戶對(duì)材料進(jìn)行「總結(jié)」和「深入討論」。
不過(guò)該功能目前仍然處于實(shí)驗(yàn)階段,比如只會(huì)英語(yǔ),無(wú)法打斷等問題。
AlphaFold 3
今年5月,谷歌的AlphaFold 3論文在Nature上發(fā)表,在預(yù)測(cè)蛋白質(zhì)與其他分子類型相互作用上性能提升了至少50%,在某些重要的相互作用類別,其準(zhǔn)確率甚至能翻倍。
論文鏈接:https://www.nature.com/articles/s41586-024-07487-w
2020年發(fā)布的AlphaFold 2實(shí)現(xiàn)了蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的根本性突破,在包括瘧疾疫苗、癌癥治療和酶設(shè)計(jì)等領(lǐng)域輔助數(shù)百萬(wàn)科研人員進(jìn)行新發(fā)現(xiàn),引用超過(guò)2萬(wàn)次。
AlphaFold 3則跳出蛋白質(zhì),進(jìn)入廣泛的生物分子領(lǐng)域,有可能解鎖更多變革性科學(xué)成果,比如開發(fā)生物可再生材料和更具彈性的作物,加速藥物設(shè)計(jì)和基因組學(xué)研究。
11月,研究人員發(fā)布了AlphaFold 3模型代碼和權(quán)重,以供學(xué)術(shù)使用。
Pixel移動(dòng)端
1月份,谷歌宣布為新款Galaxy S24系列的錄音、筆記等軟件基于Gemini Pro提供摘要能力;基于文生圖模型Imagen 2,為Galaxy S24圖庫(kù)提供生成式照片編輯功能。
八月,谷歌發(fā)布自家手機(jī)Pixel 9,使用全新的定制芯片Tensor G4提供AI計(jì)算能力,整合了大量AI能力,包括生成定制天氣報(bào)告、整理截圖信息、本地文生圖等多種功能。
其中最重要的Gemini Live,能夠以更直觀、自然的方式幫助用戶計(jì)劃旅行攻略、解決家庭維修問題、構(gòu)思禮物等等。
期待明年谷歌即將帶來(lái)的禮物。