繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

一天15k星,代碼生成碾壓Claude,連Cursor都慌了?谷歌Gemini CLI殺瘋了

2025-06-26 18:41

今天,谷歌正式發佈了 Gemini CLI ,這是其 AI 助手在終端環境下的一個版本。這款工具的亮點在於其非常慷慨的免費使用配額:它支持每分鍾 60 次、每天 1,000 次的模型調用。

免費配額「開掛」, 逼瘋 Claude? 

繼 2 月的 Claude Code 和 4 月的 OpenAI Codex CLI 之后,谷歌也在 6 月推出了 Gemini CLI。至此,三大 AI 實驗室都已發佈了各自的「終端智能體」工具——這類 CLI 工具可以讀取、修改文件,並在終端中代表用户執行命令。

估計不少人原本以為這類終端工具會一直是一個小眾方向,但現在看來這是低估了它的潛力——不少開發者每月在 Claude Code 上的花費高達數百美元 甚至是數千美元,説明這個「小眾市場」其實比預想中大得多、也重要得多。

相對 Claude Code,谷歌在價格方面可謂「豪橫」:

使用個人 Google 賬號登錄,即可免費獲得 Gemini Code Assist 許可。這將解鎖 Gemini 2.5 Pro 模型和百萬 token 上下文窗口。在此次預覽期間,谷歌提供業界最寬松的調用配額:每分鍾最多 60 次、每天最多 1000 次請求,全部免費。

目前來看,社區對 Gemini CLI 的關注重點集中在其超大免費配額上。評論者直言:「太誇張了,這會給 Anthropic 帶來巨大壓力。」「確實如此——如果這些調用限制是真的而且免費,那終於有真正的競爭了。」

與 Claude Code 不同,Gemini CLI 和 OpenAI Codex CLI 一樣是開源的(使用 Apache 2.0 許可)。並且 Gemini CLI 在不到一天的時間里,獲得了 15.1k 星。

Gemini CLI 提供的功能包括代碼編寫、問題調試、項目管理、文檔查詢以及代碼解釋。它還連接了 MCP(模型上下文協議)服務器,具備 Agentic AI 能力。

CLI 工具的優勢在於,它可以與任何編輯器或 IDE 搭配使用,而不侷限於特定插件支持的工具;同時還支持多實例併發運行。部分開發者也認為,命令行交互效率更高。

Gemini CLI 支持 Mac、Linux(包括 ChromeOS)和 Windows 平臺。與 Claude Code 或 Codex 不同的是,Windows 上為原生實現,無需依賴 Windows 子系統(WSL)。開發者可以通過在項目根目錄添加一個名為 gemini.md 的文本文件來自定義上下文和參數。谷歌高級工程師 Tayor Mullen 表示,當 CLI 檢測到「值得長期保存的細節」時,也會自動將其寫入該文件。

因為整體開源,所以我們還可以看到它的 system prompt。

一如既往,這份系統提示詞不僅定義了工具行為,也是一份非常精煉準確的使用文檔。比如它對代碼註釋的原則是:

註釋: 請謹慎添加註釋,重點説明「為什麼」要這麼做,尤其是處理複雜邏輯時,而不是解釋「做了什麼」。只有在確實能提升可讀性或用户明確要求時,才添加高價值註釋。請勿修改與你更改無關的註釋,也絕不要通過註釋與用户交流或説明你的更改

系統默認使用的技術棧也頗有參考價值。

如果用户沒有指定技術偏好,默認建議如下:

Web 前端: React(JavaScript/TypeScript)+ Bootstrap CSS,結合 Material Design 設計規範;

后端 API: Node.js + Express.js 或 Python + FastAPI;

全棧應用: Next.js(React/Node.js)+ Bootstrap + Material Design,或 Python(Django/Flask)+ React/Vue.js 前端;

命令行工具(CLI): Python 或 Go;

移動 App: Compose Multiplatform(Kotlin)或 Flutter(Dart),用於跨平臺開發;也支持 Jetpack Compose(Android)或 SwiftUI(iOS)原生開發;

3D 遊戲: HTML/CSS/JavaScript + Three.js;

2D 遊戲: HTML/CSS/JavaScript。

勝過專用, Gemini CLI 靠什麼? 

Gemini CLI 接入的是谷歌最先進的編碼與推理模型 Gemini 2.5 Pro,具備代碼理解、文件操作、命令執行和動態故障排查等能力,全面提升命令行的使用體驗。用户可以通過自然語言編寫代碼、調試問題,並優化工作流程。

不僅如此,Gemini CLI 還能基於 MCP 調用其他谷歌服務,在終端中生成圖像或視頻,實現從編碼到創作的一體化體驗。

在發佈會上展示的一體化演示和背后的技術理念,其實揭示了 Gemini CLI 的關鍵定位——它不僅是一個寫代碼的工具,而是一個連接多模態智能、打通編碼與創作的「終端智能體」。這一理念也體現在背后所依賴的 Gemini 2.5 Pro 模型選擇上。

值得注意的是,Gemini 2.5 Pro 本身並不是為代碼任務特別訓練的「代碼專用模型」,而是一個覆蓋更廣泛能力邊界的通用模型。那麼,為何谷歌沒有像某些競爭對手那樣,專門為 Gemini CLI 打造一個定製化的代碼模型?在一場深度訪談中,產品負責人 Connie Fan 和研究負責人 Danny Tarlow 分享了他們的思考。

Connie Fan 表示,雖然特定任務確實可以從專用模型中受益,例如 Cursor 訓練的代碼補全模型「在非常窄的用例里做得非常好」,但她強調,對於大多數現實世界中的開發任務而言,編碼需求往往不侷限於代碼本身。

例如她提到的一個經典「vibe check」請求:「幫我做一個泰勒·斯威夫特歌曲排行榜 app」——這就需要模型不僅懂代碼,還要理解上下文、具備常識,甚至有些 UI/UX 審美。「這些常識背后其實是用户真實的編程需求」,她總結説,「大多數通用任務,並不能從一個純代碼模型中受益。」

Danny Tarlow 則進一步指出:「代碼專用模型到底意味着什麼?‘代碼’已經不僅僅是代碼本身,它涵蓋了軟件開發過程中的各種環節,涉及多種信息源,有些專屬於代碼,有些則不是。如果只強化代碼能力而削弱其他能力,反而會限制模型的表現。我們更傾向於通用模型上的協同發展,尋求不同能力之間的融合和平衡,打造一個‘通才型’模型,這纔是更優的發展路徑。」

實際上,現在已經有越來越多開發者開始注意到 Gemini 2.5 Pro 在代碼生成和理解方面的顯著提升。

在 Claude 長期佔據主導的討論氛圍中,不少人也開始發出「Gemini 要逆襲了嗎?」、「Google 要翻盤了嗎?」的聲音。社交媒體上,有用户分享了一些開發體驗:在一個約 50 萬行代碼規模的項目中,使用 Claude Code 生成的代碼質量「遠遠不如 CLI + Gemini 2.5 Pro」,要達到同等效果,Claude 需要開發者全程盯着。

還有開發者表示,在 Trae 上使用 Gemini 2.5 Pro 編程的完成率已經大幅超過 Claude 3.7。也有開發者表示 Gemini 修復 bug 的速度明顯快於 Claude Code。

一個 3D 渲染的處理問題,讓 Claude Code 修了兩個小時的 bug 還沒解決,結果問 Gemini 2.5 Pro,只用了 5 分鍾就搞定了。感覺對於那些看起來難度比較高的問題,可以先讓 Gemini 寫好詳細的説明書,然后再讓 Claude Code 按照它來實現,這種組合用法可能會挺不錯的。

這些反饋表明,過去一年,谷歌在代碼能力上的提升已經進入「質變期」。 Gemini 編碼產品負責人 Connie Fan 表示,Gemini 2.5 Pro 之所以能獲得良好口碑,關鍵在於兩個方面的系統性演進:「數據」和「方法論」。

從數據的角度看,「代碼倉庫上下文」變得非常關鍵。現在模型的目標不再只是做簡單的代碼補全,而是要理解並修改分佈在多個文件、涉及多個模塊的大型代碼庫:「模型要能完成那些你如果花一小時坐下來,在熟悉的代碼庫上下文中親自去做的複雜改動。」

爲了讓模型真正理解這些上下文,谷歌也開始系統性地挖掘內部工程師資源。

其中還包括 Jeff Dean 這樣的一些人,「他們代表了一種‘能力新等級’的標準,」Connie 直言,「我們擁有世界上最聰明、最出色、有時也最有主見的十幾萬工程師。」藉助他們在不同語言、技術棧、經驗水平上的反饋,谷歌能夠覆蓋更廣泛的使用場景,提升模型在「專業開發者細膩口味」上的匹配能力。「我們過去其實並沒有很好地利用這一點,但現在我們開始真正這樣做了,而且效果非常驚人。」

從研究角度看,Gemini 團隊並未將全部籌碼押在「單一大上下文窗口」的方案上,而是探索雙路線:一方面持續擴展上下文長度,另一方面發展具有自主搜索、推理能力的 agentic 編程模型,模型以代理的形式與用户交互,甚至具備一定程度的自主性。

正如研究負責人 Danny Tarlow 所描述:

「如果我們把你(人類開發者)丟進一個大代碼庫里,你會怎麼做?你會用代碼搜索、看文件結構、點來點去,讀點代碼再搜索其他信息。agentic 模型就模仿了這種方式。」

更有趣的是,當模型成功處理一個百萬行代碼庫時,用户會感受到一種「魔法般」的驚喜。而這正是 Gemini 2.5 Pro 所在意的方向:不僅是模擬人類的工作方式,更是突破人類經驗限制,發展出「非人類」的全新解法。

正因如此,不少開發者開始轉而重視起谷歌在這場 AI 編程競賽中的迴歸。Gemini 是否「翻盤」尚未可知,但「趕超」的信號,正在越來越清晰。

參考鏈接:

https://www.youtube.com/watch?v=jwbG_m-X-gE

本文來自微信公眾號 「AI前線」(ID:ai-front),作者:Tina,36氪經授權發佈。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。