繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

谷歌版小鋼炮開源!0.27B大模型,4個注意力頭,專為終端而生

2025-08-15 14:41

時令 發自 凹非寺

量子位 | 公眾號 QbitAI

谷歌開源Gemma 3 270M閃亮登場!

只需幾分鍾即可完成微調,指令遵循和文本結構化能力更是驚艷,性能超越Qwen 2.5同級模型。

發佈當天,網友也懵了:以為是270B,結果居然才0.27B。

此模型小巧又高效,可以直接在瀏覽器里本地運行,不用聯網,也能生成有創意的內容,比如睡前故事。

不僅如此,還有人使用這款迷你模型構建了自己的OCR應用程序。上傳一張圖片或PDF文件,即可用LLM即時將其轉換為結構化的Markdown格式。

值得一提的是,新模型只有4個注意力頭,比Qwen 3 0.6B少12個,真是切實符合其輕量化的定位。

下面讓我們一起看看這款迷你Gemma 3到底有哪些亮點?

Gemma 3 270M核心功能

就像你不會用大錘來掛相框,同樣的原則也適用於利用人工智能。

Gemma 3 270M充分體現了這種「為工作選擇合適工具」 的理念。

作為一款基礎模型,它開箱即可精準遵循指令,而微調能徹底釋放其真正實力。

經過專門優化,它在文本分類、數據提取等任務中,都能做到準確、快速且成本可控。

簡單總結,新模型的核心功能可概括為以下4部分:

緊湊且高效的架構

這款新模型共包含2.7億參數,其中1.7億為嵌入層參數(由於龐大的詞匯量),另外1億為Transformer模塊參數。

憑藉25.6萬token的龐大詞匯量,該模型能夠處理特定及罕見詞匯,因此成為特定領域和語言中進一步微調的理想模型。

極致的能源效率

不僅如此,該模型的參數規模在終端運行毫無壓力。

內部測試表明,在Pixel 9 Pro手機(SoC芯片)上運行INT4量化版時,25輪對話僅消耗0.75%電量,堪稱能效最高的Gemma模型。

指令遵循

此次發佈包含一個經過指令微調的模型及對應的預訓練檢查點,開箱即可精準遵循常規指令。

可用於生產的量化支持

此模型提供經過量化感知訓練(QAT)的檢查點,能讓模型以INT4精度運行,且性能損耗微乎其微——這一點對於在資源受限設備上部署而言至關重要。

何時選擇迷你版Gemma 3

輕量化模型的強大威力在現實應用中已經得到了充分體現。

一個典型案例是2025年7月Adaptive ML與SK Telecom的合作,面對複雜的多語言內容審覈挑戰,他們選擇了專門化策略:沒有使用龐大的通用模型,而是對Gemma 3 4B模型進行了針對性微調。

結果令人驚艷,經過微調的專用Gemma模型不僅達到了目標任務的要求,甚至在特定任務上超越了許多體量更大的專有模型。

Gemma 3 270M旨在讓開發者進一步採用這種方法,為明確界定的任務釋放更高的效率。

那麼,什麼時候適合選擇這款迷你版Gemma 3呢?

1、批量處理專業任務:此模型尤其適合處理情感分析、實體提取、查詢路由、非結構化文本轉結構化、創意寫作及合規性檢查等。

2、嚴格控制響應時間和成本:它能大幅降低甚至消除生產環境中的推理成本,同時為用户提供更快速的響應。

經過微調的270M模型可運行於輕量、低成本的基礎設施,甚至能直接部署在終端設備上。

3、快速迭代和部署:Gemma 3 270M的小模型規模能夠實現快速的微調實驗,幫助你在數小時而非數天內找到適合你用例的完美配置。

4、確保用户隱私 :該模型可以完全在設備上運行,而無需將數據發送到雲端。

5、多任務專業部署:這款迷你模型能幫你在預算範圍內,構建並部署多個定製模型,並且每個模型都針對特定任務進行了專業訓練。

下面想要快速上手Gemma 3 270M?超簡單四步走起。

首先,你可以從Hugging Face、Ollama、Kaggle、LM Studio或Docker獲取該模型。

接着用Vertex AI、llama.cpp、Gemma.cpp、LiteRT、Keras和MLX等工具進行測試。

然后使用Hugging Face、UnSloth或JAX等工具進行個性化微調。

最后,你可以將定製好的模型一鍵部署到本地環境或谷歌Cloud Run等任何環境。

參考鏈接:

[1]https://x.com/rasbt/status/1956130338431713307

[2]https://x.com/osanseviero/status/1956024223773663291

[3]https://developers.googleblog.com/en/introducing-gemma-3-270m/

(聲明:本文僅代表作者觀點,不代表新浪網立場。)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。