谷歌(GOOGL.US)AI殺入「分「時代，Gemini三箭齊發對決OpenAI

2025-02-06 09:03

智通財經APP獲悉，谷歌(GOOGL.US)於周三正式向所有人發佈了其「最強大」的人工智能模型套件——Gemini 2.0。這一全面發佈的模型套件包括三個核心版本：2.0 Flash、2.0 Pro Experimental 和 2.0 Flash-Lite。其中，2.0 Flash 是「主力模型」，適用於大規模高容量、高頻率任務;2.0 Pro Experimental 專注於提升編程性能，支持200萬tokens的輸入容量;而2.0 Flash-Lite 則是谷歌稱作「迄今為止最具成本效益的模型」，每百萬tokens處理成本僅為0.75美分，相比2.0 Flash 的10美分更具性價比。

此次發佈是谷歌在人工智能代理領域的重要佈局。人工智能代理能夠代表用户自動完成複雜的多步驟任務，而無需用户逐步指導。谷歌在去年12月的博客文章中提到，Gemini 2.0 在多模態能力方面取得了新進展，支持文本、圖像和音頻等多種數據類型，並具備原生工具調用能力。這些特性使該模型系列更接近「通用型數字助手」的願景。

與此同時，科技巨頭和初創公司之間的人工智能軍備競賽正在加劇。Meta(META.US)、亞馬遜(AMZN.US)、微軟(MFT.US)、OpenAI 和 Anthropic 等公司都在加速開發類似的人工智能代理系統。

例如，Anthropic 在去年10月宣佈其智能體能夠像人類一樣使用計算機完成複雜任務。據瞭解，Anthropic 是一家由前 OpenAI 研究主管創立的人工智能初創公司，得到了亞馬遜的支持，已成為開發人工智能代理領域的重要競爭力量。

這家初創公司表示，Anthropic 的技術通過其強大的計算機使用能力，能夠解釋計算機屏幕上的內容、選擇按鈕、輸入文本、瀏覽網站，並通過任何軟件和實時互聯網執行復雜任務。

Anthropic 首席科學官賈里德·卡普蘭(Jared Kaplan)在接受採訪時表示，該工具「基本上能夠像人類一樣使用計算機」，並強調它可以完成涉及「數十甚至數百個步驟」的複雜任務。

與此同時，OpenAI 最近推出了一項名為 Operator 的功能，該功能能夠自動執行一系列複雜任務，例如計劃假期、填寫表格、預訂餐廳以及訂購雜貨。這家由微軟支持的初創公司將 Operator 描述為「一個能夠上網為您執行任務的智能代理」。

本周早些時候，OpenAI 進一步拓展了其技術邊界，推出了 Deep Research。這項新功能允許 AI 代理編寫複雜的研究報告，並分析用户選擇的問題和主題。值得注意的是，谷歌在去年 12 月也推出了一款同名的工具——Deep Research，它被設計為一個「研究助手」，能夠探索複雜主題並代表用户編寫報告。

谷歌計劃在2025年初推出更多人工智能功能，其首席執行官桑達爾·皮查伊 (Sundar Pichai) 在當時的戰略會議上表示：「從歷史上看，你並不一定總是第一個進入市場，但關鍵在於執行力——真正成為同類產品中最好的。我認為，這正是 2025 年對我們而言最重要的意義所在。」

谷歌(GOOGL.US)AI殺入「分「時代，Gemini三箭齊發對決OpenAI

推薦文章

美股機會日報 | 凌晨3點！美聯儲將公佈1月貨幣政策會議紀要，納指期貨漲近0.5%；13F大曝光！巴菲特連續三季減持蘋果

美股機會日報 | 阿里發佈千問3.5！性能媲美Gemini 3；馬斯克稱Cybercab將於4月開始生產

港股周報 | 中國大模型「春節檔」打響！智譜周漲超138%；鉅虧超230億！美團周內重挫超10%

一周財經日曆 | 港美股迎「春節+總統日」雙假期！萬億零售巨頭沃爾瑪將發財報

從軟件到房地產，美國多板塊陷入AI恐慌拋售潮

Meta計劃為智能眼鏡添加人臉識別技術

危機四伏，市場卻似乎毫不在意

財報前瞻 | 英偉達Q4財報放榜在即！高盛、瑞銀預計將大超預期，兩大關鍵催化將帶來意外驚喜？