谷歌Gemini 2.5 Flash-Lite亮相

分享至

評(píng)論

2025-06-18 09:38:12　來源: 書生家電網(wǎng)　瀏覽次數(shù)：

　2025年6月18日，書生家電網(wǎng)近日?qǐng)?bào)道，谷歌宣布推出全新輕量級(jí)Gemini 2.5 Flash-Lite，同時(shí)將Gemini 2.5 Flash和Gemini 2.5 Pro模型升級(jí)至穩(wěn)定版本。據(jù)谷歌官方披露，F(xiàn)lash-Lite是該系列中成本效益最高、推理速度最快的模型，已在代碼編寫、科學(xué)計(jì)算、多模態(tài)分析等任務(wù)中超越前代2.0 Flash-Lite版本，延遲表現(xiàn)也優(yōu)于舊版，尤其適合翻譯、分類等需快速響應(yīng)的場(chǎng)景。

　測(cè)試數(shù)據(jù)顯示，F(xiàn)lash-Lite在代碼生成和數(shù)學(xué)推理基準(zhǔn)測(cè)試中綜合質(zhì)量提升顯著，其首token響應(yīng)時(shí)間較2.0版本縮短約15%，解碼速度（每秒生成token數(shù)）提高20%。該模型繼承Gemini 2.5系列核心能力，包括支持100萬token超長(zhǎng)上下文處理、連接谷歌搜索及代碼執(zhí)行工具，并允許開發(fā)者通過API動(dòng)態(tài)調(diào)整“思考預(yù)算”。

　定價(jià)方面，谷歌同步調(diào)整了Gemini 2.5 Flash的費(fèi)用結(jié)構(gòu)：輸入單價(jià)從每百萬token 0.15美元上調(diào)至0.30美元，輸出單價(jià)從3.50美元下調(diào)至2.50美元，取消此前“思考”與“非思考”兩檔定價(jià)。谷歌表示，這一調(diào)整簡(jiǎn)化開發(fā)者成本控制邏輯。

　目前，F(xiàn)lash-Lite預(yù)覽版已通過Google AI Studio和Vertex AI平臺(tái)開放，Spline、Rooms等初創(chuàng)企業(yè)，以及Snap、SmartBear等科技公司已開始基于穩(wěn)定版模型開發(fā)生產(chǎn)級(jí)應(yīng)用。谷歌搜索部門亦部署了定制化版本的Flash-Lite和Flash模型，以優(yōu)化服務(wù)響應(yīng)效率。

THE END

谷歌X實(shí)驗(yàn)室谷歌平板電腦使用說明書谷歌手機(jī)地圖導(dǎo)航