2025年6月18日,書生家電網(wǎng)近日?qǐng)?bào)道,谷歌宣布推出全新輕量級(jí)Gemini 2.5 Flash-Lite,同時(shí)將Gemini 2.5 Flash和Gemini 2.5 Pro模型升級(jí)至穩(wěn)定版本。據(jù)谷歌官方披露,F(xiàn)lash-Lite是該系列中成本效益最高、推理速度最快的模型,已在代碼編寫、科學(xué)計(jì)算、多模態(tài)分析等任務(wù)中超越前代2.0 Flash-Lite版本,延遲表現(xiàn)也優(yōu)于舊版,尤其適合翻譯、分類等需快速響應(yīng)的場(chǎng)景。
測(cè)試數(shù)據(jù)顯示,F(xiàn)lash-Lite在代碼生成和數(shù)學(xué)推理基準(zhǔn)測(cè)試中綜合質(zhì)量提升顯著,其首token響應(yīng)時(shí)間較2.0版本縮短約15%,解碼速度(每秒生成token數(shù))提高20%。該模型繼承Gemini 2.5系列核心能力,包括支持100萬token超長(zhǎng)上下文處理、連接谷歌搜索及代碼執(zhí)行工具,并允許開發(fā)者通過API動(dòng)態(tài)調(diào)整“思考預(yù)算”。
定價(jià)方面,谷歌同步調(diào)整了Gemini 2.5 Flash的費(fèi)用結(jié)構(gòu):輸入單價(jià)從每百萬token 0.15美元上調(diào)至0.30美元,輸出單價(jià)從3.50美元下調(diào)至2.50美元,取消此前“思考”與“非思考”兩檔定價(jià)。谷歌表示,這一調(diào)整簡(jiǎn)化開發(fā)者成本控制邏輯。
目前,F(xiàn)lash-Lite預(yù)覽版已通過Google AI Studio和Vertex AI平臺(tái)開放,Spline、Rooms等初創(chuàng)企業(yè),以及Snap、SmartBear等科技公司已開始基于穩(wěn)定版模型開發(fā)生產(chǎn)級(jí)應(yīng)用。谷歌搜索部門亦部署了定制化版本的Flash-Lite和Flash模型,以優(yōu)化服務(wù)響應(yīng)效率。