繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

谷歌(GOOGL.US)更新Gemini API定價 按推理使用分檔計費

2026-04-03 14:13

智通財經APP獲悉,谷歌(GOOGL.US)近日對Gemini API的計費檔位進行更新,優化方案與定價均基於實際推理使用需求制定。

本次新增的推理服務檔位包括:標準(Standard)、彈性(Flex)、優先(Priority)、批量(Batch)和緩存(Caching)版。

谷歌表示:「Gemini API提供多種優化機制,可根據具體業務負載需求,在運行速度、使用成本與服務穩定性之間實現平衡。無論是搭建實時對話機器人,還是運行大型離線數據處理流程,選擇合適的運行模式都能顯著降低成本或提升運行效率。」

其中,彈性推理檔位通過利用非高峰閒置算力資源,提供標準價格五折優惠,目標延迟為1至15分鍾,但不提供延迟保證。批量API檔位同樣提供標準費率五折優惠,延迟最長可達24小時。

緩存檔位計費依據緩存詞元(Token)數量與存儲時長,推薦用於搭載複雜系統指令的對話機器人、長視頻文件重複分析,以及大規模文檔集查詢等場景。

優先檔位定價則比標準價格高出75%至100%,延迟可控制在毫秒至秒級。谷歌建議該檔位用於實時客服聊天機器人、實時欺詐檢測及業務關鍵型智能助手等場景。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。