繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

谷歌(GOOGL.US)AI殺入「分「時代,Gemini三箭齊發對決OpenAI

2025-02-06 09:03

智通財經APP獲悉,谷歌(GOOGL.US)於周三正式向所有人發佈了其「最強大」的人工智能模型套件——Gemini 2.0。這一全面發佈的模型套件包括三個核心版本:2.0 Flash、2.0 Pro Experimental 和 2.0 Flash-Lite。其中,2.0 Flash 是「主力模型」,適用於大規模高容量、高頻率任務;2.0 Pro Experimental 專注於提升編程性能,支持200萬tokens的輸入容量;而2.0 Flash-Lite 則是谷歌稱作「迄今為止最具成本效益的模型」,每百萬tokens處理成本僅為0.75美分,相比2.0 Flash 的10美分更具性價比。

此次發佈是谷歌在人工智能代理領域的重要佈局。人工智能代理能夠代表用户自動完成複雜的多步驟任務,而無需用户逐步指導。谷歌在去年12月的博客文章中提到,Gemini 2.0 在多模態能力方面取得了新進展,支持文本、圖像和音頻等多種數據類型,並具備原生工具調用能力。這些特性使該模型系列更接近「通用型數字助手」的願景。

與此同時,科技巨頭和初創公司之間的人工智能軍備競賽正在加劇。Meta(META.US)、亞馬遜(AMZN.US)、微軟(MFT.US)、OpenAI 和 Anthropic 等公司都在加速開發類似的人工智能代理系統。

例如,Anthropic 在去年10月宣佈其智能體能夠像人類一樣使用計算機完成複雜任務。據瞭解,Anthropic 是一家由前 OpenAI 研究主管創立的人工智能初創公司,得到了亞馬遜的支持,已成為開發人工智能代理領域的重要競爭力量。

這家初創公司表示,Anthropic 的技術通過其強大的計算機使用能力,能夠解釋計算機屏幕上的內容、選擇按鈕、輸入文本、瀏覽網站,並通過任何軟件和實時互聯網執行復雜任務。

Anthropic 首席科學官賈里德·卡普蘭(Jared Kaplan)在接受採訪時表示,該工具「基本上能夠像人類一樣使用計算機」,並強調它可以完成涉及「數十甚至數百個步驟」的複雜任務。

與此同時,OpenAI 最近推出了一項名為 Operator 的功能,該功能能夠自動執行一系列複雜任務,例如計劃假期、填寫表格、預訂餐廳以及訂購雜貨。這家由微軟支持的初創公司將 Operator 描述為「一個能夠上網為您執行任務的智能代理」。

本周早些時候,OpenAI 進一步拓展了其技術邊界,推出了 Deep Research。這項新功能允許 AI 代理編寫複雜的研究報告,並分析用户選擇的問題和主題。值得注意的是,谷歌在去年 12 月也推出了一款同名的工具——Deep Research,它被設計為一個「研究助手」,能夠探索複雜主題並代表用户編寫報告。

谷歌計劃在2025年初推出更多人工智能功能,其首席執行官桑達爾·皮查伊 (Sundar Pichai) 在當時的戰略會議上表示:「從歷史上看,你並不一定總是第一個進入市場,但關鍵在於執行力——真正成為同類產品中最好的。我認為,這正是 2025 年對我們而言最重要的意義所在。」

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。