Google 正式發(fā)布 Gemini 2.5 系列穩(wěn)定模型
Google 宣布,Gemini 2.5 Pro 與 Gemini 2.5 Flash 現(xiàn)已進(jìn)入穩(wěn)定狀態(tài)并全面上線。同時(shí),Google 還推出了全新的 Gemini 2.5 Flash-Lite(預(yù)覽版) ——這是目前最快、最具成本效益的 Gemini 2.5 模型。

Gemini 2.5 Pro(穩(wěn)定版)
- 推理能力增強(qiáng):模型具備“思考預(yù)算”機(jī)制,可在響應(yīng)前先進(jìn)行“思考”,提高整體準(zhǔn)確率,尤其在數(shù)學(xué)與科學(xué)類基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異。
- 原生多模態(tài)處理能力:支持文本、圖像、音頻、視頻等輸入輸出,并按格式計(jì)費(fèi)。
- 上下文窗口擴(kuò)大至 100 萬 token:適用于長文檔處理與多輪對(duì)話。
- 原生音頻(預(yù)覽):支持實(shí)時(shí)語音輸出,可在 24 種語言間自然切換,并具備語氣控制、環(huán)境噪音過濾能力。

- 高級(jí)代碼能力:在 Web 開發(fā)相關(guān)任務(wù)中表現(xiàn)突出,在 WebDev Arena 等基準(zhǔn)測(cè)試中得分領(lǐng)先。

- 工具調(diào)用能力:支持實(shí)時(shí)信息訪問、代碼執(zhí)行、結(jié)構(gòu)化輸出、函數(shù)調(diào)用、搜索增強(qiáng)等功能。
Gemini 2.5 Flash(穩(wěn)定版)
- 價(jià)格優(yōu)化:輸出 token 成本從 降至2.50 /百萬,輸入成本略升至 $0.30 /百萬。
- 統(tǒng)一計(jì)價(jià)模型:取消了“思考”與“非思考”之間的計(jì)費(fèi)區(qū)分,簡(jiǎn)化開發(fā)流程。

Gemini 2.5 Flash-Lite(預(yù)覽版)
- 主打速度與低延遲:相比舊版 Flash 模型,F(xiàn)lash-Lite 提供更快響應(yīng)、更低首 token 延遲。
- 默認(rèn)關(guān)閉思考模式:以壓縮成本為優(yōu)先,開發(fā)者可通過 API 參數(shù)開啟推理模式。
- 支持核心工具能力:包括代碼執(zhí)行、搜索增強(qiáng)、URL 上下文引用、函數(shù)調(diào)用等。
- 適合場(chǎng)景:高吞吐量任務(wù),如文本分類、摘要、輕量對(duì)話系統(tǒng)等。

性能對(duì)比(思考 vs 非思考模式)
任務(wù)類型 | Flash-Lite 非思考 | Flash-Lite 啟用思考 |
數(shù)學(xué)推理 | 49.8% | 63.1% |
編碼能力 | 33.7% | 34.3% |
長上下文處理 | 16.6% | 30.6% |
圖像理解與多語言任務(wù) | 普通表現(xiàn) | 明顯提升 |
簡(jiǎn)單摘要/分類任務(wù) | 84.1% | 86.8% |
對(duì)于性能敏感型項(xiàng)目,可默認(rèn)關(guān)閉推理,以獲得最大吞吐率;在需要更高準(zhǔn)確率場(chǎng)景下再開啟推理模式,實(shí)現(xiàn)靈活折中。
如何訪問 Gemini 2.5 模型?
途徑一:Gemini Chat App
在左上角模型選擇器中可切換至 2.5 Pro 或 2.5 Flash 模型使用。

途徑二:Google AI Studio
可自定義溫度、思考模式、預(yù)算等高級(jí)參數(shù),適合開發(fā)者調(diào)試及部署。

途徑三:Google Vertex AI API
通過 Vertex AI 提供的 API 接口接入 Gemini 2.5 系列模型,支持 CLI 或 Python 等方式調(diào)用。
示例(Python 接入 Gemini 2.5 Pro):
from google import genai
from google.genai import types
client = genai.Client(vertexai=True, project="YOUR_PROJECT_ID", locatinotallow="global")
response = client.models.generate_content(
model="gemini-2.5-pro",
cnotallow=[
"What is shown in this image?",
types.Part.from_uri(
file_uri="gs://generativeai-downloads/images/scones.jpg",
mime_type="image/png",
),
],
)
print(response.text)開發(fā)者注意事項(xiàng)
- Gemini Pro Preview 05–06 將于 2025 年 6 月 19 日下線;
- Preview 06–05 用戶需更新模型 ID 至
"gemini-2.5-pro"; - 建議升級(jí)舊版 Flash 1.5/2.0 用戶至 Flash-Lite,以獲取更快速度與更優(yōu)性價(jià)比。

小結(jié)
Gemini 2.5 的發(fā)布表明 Google 正在持續(xù)加碼生成式 AI 模型的產(chǎn)品化與實(shí)用化。無論是 Pro 版本的推理能力與多模態(tài)支持,還是 Flash-Lite 的極致效率,在 AI 工具開發(fā)者社區(qū)中都具有廣泛應(yīng)用潛力。
開發(fā)者可根據(jù)自身項(xiàng)目需求,在 Pro 深度推理能力與 Flash-Lite 高吞吐性能之間做出靈活選擇。



























