谷歌升級雙子座3跨科學、工程的深度思考模型

2026-02-13 00:58

Alphabet（GOOG）（GOOGL）的谷歌在科學、編碼、研究和工程領域升級了其Gemini 3 Deep Think。

谷歌表示，新的Deep Think現已在Gemini應用程序中供Google AI Ultra訂閲者使用。該公司補充説，它首次通過Gemini API向選擇研究人員、工程師和企業提供Deep Think。

通過更新的模型，用户可以將草圖變成3D可打印的現實。據谷歌稱，Deep Think分析繪圖，對複雜的形狀進行建模，並生成一個文件，以通過3D打印創建物理對象。

「除了其最先進的性能外，Deep Think還旨在推動實際應用，使研究人員能夠解釋複雜的數據，使工程師能夠通過代碼對物理系統建模。最重要的是，我們正在努力將深度思考帶給研究人員和從業者最需要的地方--從Gemini API等表面開始，」該公司在周四的一篇博客文章中表示。

更新后的Deep Think在多個學術基準上表現出更好的表現。該模型為人類最后一次考試設定了新標準（48.4%，沒有工具），這是一個旨在測試現代前沿模型極限的基準。

該公司指出，該模型在ARC獎基金會驗證的推理任務基準ARC-AGI-2上實現了前所未有的84.6%。它還在CodeForces上獲得了3455的Elo，這是一個由競爭性編程挑戰組成的基準。去年，該模型在數學和編程世界錦標賽上達到了金牌標準。

除了數學和有競爭力的編碼，Gemini 3 Deep Think現在還在化學和物理等廣泛的科學領域表現出色。

該公司指出，更新后的模型還顯示了2025年國際物理奧林匹克競賽和化學奧林匹克競賽書面部分的金牌級別成績。它表現出對高級理論物理的熟練程度，在CMT-Benchmark上得分為50.5%。

雙子座3 Deep Think於2025年11月宣佈成為雙子座3套件的一部分。

谷歌的Gemini與多款人工智能產品競爭，包括OpenAI（OPNAI）的ChatGPT和Anthropic（ANTHRO）的Claude。