?對標DeepSeek,Gemini 2.0輕量模型開卷“極致性價比”!谷歌守住多模態(tài)陣地應(yīng)用們都要開始做推理了! 原創(chuàng)
編輯 | 伊風(fēng)
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
DeepSeek的火熱,讓Google坐不住了!
深夜,Google推出了Gemini 2.0全家桶,一口氣推出了三個模型型號:Gemini 2.0 Flash、Gemini 2.0 Flash-LiteGemini 2.0 Pro。
圖片
看技術(shù)報告,2.0系列的三個模型在通用、代碼、推理、事實性、多語言等方面指標如下。比起此前Gemini 1.5系列著實有了多維度的進化,但明顯沒有性能的斷層式飛躍。
圖片
再來看最近AI圈關(guān)注的重中之重——推理。谷歌也在Gemini 2.0的技術(shù)報告里強調(diào)了一把,Gemini 2.0 Flash Thinking全面上線了!
圖片
外媒TechCruch,在報道中明說了谷歌不甘自家推理模型受冷落,想借2.0更新的檔口加一把火的意思:“Google 和 DeepSeek 都在去年 12 月發(fā)布了 AI 推理模型,但 DeepSeek 的 R1 模型受到了更多關(guān)注。如今,Google 可能希望通過廣受歡迎的 Gemini 應(yīng)用,讓更多用戶接觸到其 Gemini 2.0 Flash Thinking 模型?!?/p>
其中最大的亮點,就是谷歌直接把推理放到了YouTube、Maps 和 Search里!也就是說,你可以直接讓Gemini 2.0 Flash Thinking幫你推理下油管近期的爆款視頻元素。
這點還是很讓人振奮的,感覺谷歌終于聰明了一把,應(yīng)用們集體做推理的時代已經(jīng)不遠了!
還有一個與DeepSeek相關(guān)的趣事,在AI界“拼多多”的影響下,谷歌也開始玩極致性價比了。
帶隊Gemini 2.0的大佬Logan都出來打了個廣告,稱Gemini 2.0 Flash是最“劃算”的大模型了,抓緊用吧!
圖片
Logan說得不錯,尤其是輕量的Gemini 2.0 Flash-Lite模型,其定價更低:
輸入:$0.075/百萬 tokens
輸出:$0.30/百萬 tokens
相比之下,市場上的其他 LLM:
OpenAI 4o-mini:$0.15(輸入) / $0.6(輸出)
Anthropic Claude:$0.8(輸入) / $4(輸出)
DeepSeek V3:$0.14(輸入) / $0.28(輸出)
看來AI圈的又一波降價促銷即將到來,不過,Gemini 2.0 與 DeepSeek-R1、OpenAI o3的推理還是有相當(dāng)大的區(qū)別,就像是把“蘋果與橙子”放在一起比較。
1.多模態(tài)仍是谷歌核心優(yōu)勢,多應(yīng)用接入未來可期
從這張時間表來看,Google 的核心優(yōu)勢仍然在多模態(tài)能力上。
圖片
此前,Google DeepMind 的 CTO Koray Kavukcuoglu 在公司博客中寫道:“這些模型在發(fā)布時將支持多模態(tài)輸入(文本輸出),并將在未來幾個月內(nèi)開放更多模態(tài)的全面使用?!?/p>
在谷歌生態(tài)里,多模態(tài)能力發(fā)揮的空間很大。推特博主@Paul Couvert說,作為首個能夠訪問 YouTube 的推理模型,AI已經(jīng)能幫你量身寫作短視頻腳本了,tips 如下:
- 搜索與您的主題相關(guān)的視頻
- 讓 Gemini 對視頻進行思考
- 您將在 10 秒內(nèi)得到一個量身定制的結(jié)果!
而在map里,Gemini 2.0的支持讓地圖化身“地球探索器”,可以通過推理為用戶提供更多有趣的地方。
當(dāng)用戶說:帶我去一個自然風(fēng)光優(yōu)美、綠意盎然的地方。
AI回復(fù)道:去也門的索科特拉群島怎么樣?這里獨特得仿佛踏上另一個星球。由于長期的與世隔絕,這里孕育出了奇特而美麗的植物,如龍血樹和多肉瓶樹。
圖片
相較而言,DeepSeek 和 OpenAI 等競爭對手專注在單一模態(tài)的大模型中,DeepSeek-R1 和 OpenAI 的 o3-mini 仍無法直接處理多模態(tài)輸入(即無法解析圖片、文件上傳或附件)。雖然 DeepSeek-R1 在其網(wǎng)站和移動端支持圖片上傳,但它僅使用 光學(xué)字符識別(OCR) 來提取圖片中的文本內(nèi)容,而不是真正理解或分析圖片的其他信息。
不過,谷歌能否將應(yīng)用中的AI推理做得真正實用,還需要時間的檢驗。
2.Gemini 2.0 Pro 秀肌肉:2百萬 token 超長上下文、最強大的編碼模型
Google 堅持走長上下文路線。Gemini 2.0 Pro 的實驗版本,更是達到了2百萬 tokens之大。
Google DeepMind 將其描述為最強大的編碼模型,可處理復(fù)雜提示詞,其特性如下:
- 2百萬 tokens 上下文窗口(比 Flash 和 Flash-Lite 翻倍);
- 改進的推理能力;
- 集成 Google Search 和代碼執(zhí)行能力。
DeepMind首席科學(xué)家盛贊說,“它能寫出完整的代碼,包括所有正確的數(shù)據(jù)結(jié)構(gòu)和搜索算法,根據(jù)一個相對簡單的提示,在 Boggle 棋盤上找到所有有效的單詞,這真是令人匪夷所思!”
圖片
此外, Gemini 2.0 Pro的編輯功能也大受好評,網(wǎng)友直接讓AI使用 Three.js,手搓了一個太陽系模擬。
圖片
對標DeepSeek,Gemini 2.0輕量模型開卷“極致性價比”!谷歌守住多模態(tài)陣地,油管、地圖應(yīng)用們都要開始做推理了!
觀看更多轉(zhuǎn)載,對標DeepSeek,Gemini 2.0輕量模型開卷“極致性價比”!谷歌守住多模態(tài)陣地,油管、地圖應(yīng)用們都要開始做推理了!51CTO技術(shù)棧已關(guān)注分享點贊在看已同步到看一看寫下你的評論 視頻詳情
3.寫在最后
這邊,Gemini 2.0 正在迎來高光時刻。
然而, OpenAI 卻突然放出大招,谷歌一夜醒來發(fā)現(xiàn)被偷家了。
ChatGPT正式開放了搜索功能,免注冊免費用,網(wǎng)友在評論中驚呼:“谷歌一下”可能要變成“AI 一下”了。
圖片
有了亮眼的Gemini 2.0,谷歌仍然不能喘一口氣:2025 年的 AI 之戰(zhàn)注定不會輕松。連 CEO 桑達爾·皮查伊都坦言:“今年將是一場硬仗?!?/p>
參考鏈接:
1.??https://developers.googleblog.com/en/gemini-2-family-expands/?linkId=12807127??
2.??https://techcrunch.com/2025/02/05/google-launches-new-ai-models-and-brings-thinking-to-gemini/??
本文轉(zhuǎn)載自5??1CTO技術(shù)棧??,作者:伊風(fēng)
