熱門資訊> 正文
2025-01-27 13:07
衡宇 發自 凹非寺
量子位 | 公眾號 QbitAI
明天就是辭舊迎新的春節假期,咱來點不一樣的——
送上一份「年初展望」,站在2025年伊始,把AI科技領域不同領域的熱點趨勢,淺淺盤了一圈。
從人型機器人、AI眼鏡,從推理模型到AI Coding……分別從產品側和技術側,把今年最有料的8個大熱門趨勢一網打盡,乾貨過年。
產品側:人形機器人,AI眼鏡,智能駕駛,AI陪伴
技術側:Inference-Scaling,視頻生成,AI Coding,空間智能
這是編輯部在縱觀歲末年初全球各式各樣的展會、論壇、圓桌,訪問眾多產學研領域眾多機構之后,對整個行業變革趨勢的洞察。
邀請諸君共賞,共同參與或觀望。
這怎麼不算一種AI科技年夜飯呢?(手動狗頭)
01 產品側
Part 1:人形機器人
如果以2021年馬斯克在首屆特斯拉AI Day上公佈人形機器人Optimus(擎天柱)概念為起點,回顧過去的3年,賽道逐漸火熱,全球巨頭加碼,創業團隊入局。
加上2023年起,隨着AI大模型技術的進步和仿真環境的改進,具身智能再為人形機器人加了一把烈火——中科院院士姚期智也曾表達自己的看法,稱人形是最適合實現通用具身智能的形態。
隨之而來的結果,就是人形機器人井噴,並迅速從概念走向實機、從實驗室走向室外開放世界。
迄今為止,人形機器人的最高潮當屬月初CES 2025上,老黃帶着人形機器人天團的激情開場:
14個「as the same size (with me)」的人形機器人在他背后列隊現身,非常之震撼。
14個人形機器人中,有6個來自中國:
一周前,在北京,英偉達機器人與邊緣計算副總裁又透露正在構建一個平臺,幫助機器人專家、研究人員、機械工程師和測試人員更輕松地開發機器人解決方案。
一切正在加速中。
且潛力不必多言:麥肯錫報告顯示,至2030年,全球人形機器人市場空間可達12-16萬億元。
而我們剛剛步入的2025年,或許就是人形機器人量產元年:
國外,特斯拉Optimus有望年內進入小批量量產階段,馬斯克豪言2026年有望實現大規模量產;國內,智元機器人月初官宣量產的731台人形機器人正式下線……
Part 2:AI眼鏡
2024年年中,Ray-Ban Meta出貨量超過100萬台,徹底點燃了全球AI眼鏡賽道。
「眼鏡一定是承載AI功能的最重要載體之一」已成為行業共識,不信你看CES,簡直可以稱之為AI眼鏡競技場——據不完全統計,有近50家AI眼鏡在CES現場進行展示,其中中國玩家就有至少有14個。
遍觀中外媒體、KOL的報道與探展,這些已亮相AI眼鏡大致可分為三類:
純音頻AI眼鏡
音頻+拍照AI眼鏡
帶顯示AI眼鏡
如此激烈的盛況吸引全行業的目光,尤其是作為先行者的Meta,自然格外關注。
據瞭解,近日Meta一名混合現實產品團隊核心成員在硅谷表示,百鏡大戰中令他印象最深的產品之一,是一款名為Halliday的AI眼鏡(這也是《頭號玩家》中游戲「綠洲」創始人的名字)。
他解釋是被Halliday獨特的成像方式所吸引。Halliday沒有選擇通過各種鏡片反射來成像,而是使用DigiWindow顯示技術,在鏡框上方內側放置光學模組,把需要從AI獲得的信息直接光投影至用户的視網膜成像。
這就避免了其他AI眼鏡的彩虹紋、漏光等問題,還提高了獲取信息的效率。
這和目前所有的其它AI眼鏡打出了差異化。
當下有個並不意外的現實,那就是CES結束后的1個月內,AI眼鏡的關注和討論仍在持續攀升。
一方面,展會強影響力帶來長尾效應;另一方面,多個品牌AI眼鏡開始發貨,用户上手測評反饋俯拾皆是。
混戰之中,Halliday在2天前也刷了一次屏:全球最大眾籌平臺Kickstarter上,上線72小時的Halliday眾籌額已超過137萬美元(約992.6萬元),超募6861%,創史上最大AR/AI眼鏡項目眾籌紀錄。
行業內閃耀CES,用户圈層又有眾籌成績認可,究其原因,或是其獨特的自我定位:
不是電子消費品,而是時尚科技品。
簡單來説,就是該產品雖然具備AI功能,但首先會先滿足「一副很棒的普通眼鏡」這一條件。
「很棒」體現在能夠日常佩戴,包括但不限於佩戴舒適(35g市場最輕重量+超12小時長續航)、時尚好看、可矯正視力(自帶免費配鏡)等等,然后再在此基礎上,「只開發在智能眼鏡上有意義的功能」。
此外,爲了不復制手機功能,Halliday主打生產力場景;爲了融入用户日常,它在傳統交互形式上增設指環交互形式,不依賴手機,也不用用户在人羣中虛空對話。
(i人狂喜中.gif)
很有意思的是,Halliday背后是中國美瞳一哥。
它由國內彩瞳品牌moody核心團隊孵化和獨立運營,公司CEO也是moody創始人、CEO慈然;另一邊,DigiWindow技術由新加坡AI硬件整合服務商Gyges Labs提供,在Halliday眼鏡上搭載了全球最小最輕的近眼顯示光學模組。
可喜可賀,賽道發令槍剛打響,已經有人率先擺脫桎梏,不再被Ray-Ban Meta的先驗經驗束縛住了。
2025年,以Halliday為代表,AI眼鏡行業開始出現新的前沿創新形式;聚焦到Halliday本身,則是用眼鏡市場的視角和積澱,把AI眼鏡的用户體驗往前推進了一大步。
Part 3:智能駕駛
在黃仁勛CES演講的后半段,有一段至今被熱議的總結。
世界上有三種機器人,它們可以製造出來並且不需要綠地(經過開發的場地),棕地(未經開發的場地)適應的特性非常完美。
這三種機器人,其中之一就是自動駕駛汽車(還有一個是人形機器人)。
L4級別的自動駕駛雖然尚在彼岸,但智能駕駛,已經成為車圈豪華新標準,科技平權新方向。
在過去的2024年,智能駕駛通過兩個端到端加速洗牌,分別是:
技術架構的端到端:擺脫高精地圖依賴,實現無圖NOA(領航輔助駕駛);
產品體驗的端到端:從單城市試點,到全國鋪開,再到「車位到車位」,智駕可用範圍和時段迅猛增加。
基於此,L2+體驗不斷拔高,行業開始瞄向L3進軍,逐漸具備L3的技術基礎、配套政策和保障機制。
L3商用,有望成為2025年的急先鋒。
與此同時,作為L4級自動駕駛技術的核心應用場景,Robotaxi也勢頭正盛。
全球一哥Waymo每周載客早已超15萬單;國內方面,近期有文遠知行、小馬智行相繼敲鍾上市。
再加上馬斯克預判,Robotaxi的每公里運營成本將低於1元——7*24小時全天候運營的Robotaxi,在全球廣袤的範圍內商業化正火線提速。
根據量子位智庫基於公開數據測算,2025年,國內Robotaxi市場規模就將達到10.92億元。
Part 4:AI陪伴
AI陪伴,一直是眾多公司佈局AI Native應用的重要選擇。
據量子位智庫報告調研,這個賽道在過去一年中,國內有20家公司共推出了21款產品;但報告統計數據顯示,2024年,國內AI陪伴的新增速度和用户活躍等數據普遍下滑,后繼乏力。
這可能與市場趨於飽和、用户需求變化以及技術創新不足等因素有關。
不過CES讓AI陪伴柳暗花明又一村,人們發現,AI陪伴已經開始從線上向線下轉移。
具體表現為Moflin、Mirumi、Nékojita FuFu、Ropet、Ai Me等各式各樣AI玩具的玩具出現。
它們通過AI技術,根據環境進行感知,有的具備情感模擬能力,而有的甚至無法與人類進行基本的淺層交互。
但AI玩具大有成為熱門潮玩的趨勢,究其根本原因,繞不開其提供的新鮮體驗和情感支持。
以及其作為AI陪伴的物理世界載體,不再只盯着兒童用户做「陪伴」,轉向擴展到多年齡段用户。
也就是説,2025年,線上增長放緩的AI陪伴,正在從虛擬應用向實體硬件轉型,產品設計趨向於更加擬人化和情感化,以滿足用户對陪伴和互動的需求。
02 技術側
Part 5:Inference-Scaling
毫無疑問,2025技術側已經能看見火花的重要趨勢,必然有因OpenAI o1掀起的Scaling新範式:
Inference-Scaling。
與1年前技術領域普遍信仰的傳統Scaling Law不同,Inference-Scaling強調了后訓練(post-training)和推理階段(inference-time)計算投入的重要性,與之對應的結果是模型推理能力的大幅提升。
這就意味着大模型資源開始向Post-training和推理算力傾斜。
也意味着新一輪競賽的開始。
單看國內,短短几個月內已經有崑崙萬維Skywork o1、阿里通義QVQ、智譜華章GLM-Zero-Preview、階躍星辰Step R-mini、深度求索DeepSeek-R1、月之暗面Kimi k1.5、百川智能Baichuan-M1-preview等多個推理模型問世。
需要重點關注的是,OpenAI CEO山姆·奧特曼非常明確地對外宣稱,「o1只是推理模型的GPT-2時刻」。
事實似乎也的確如此——
從推理能力上來説,谷歌版o1,即Gemini 2.0 Flash Thinking,思考速度比(發佈時市面上)所有模型快5倍;OpenAI較o1成立提升不止一倍的o3系列中,mini已可使用。
從泛化能力上來説,inference-Scaling並非只在語言大模型領域生效,o3、QVQ、Baichuan-M1-preview等都證明其可以泛化至視覺領域。
從模型成本上來説,DeepSeek-R1在訓練層面的創新與工程優化,又將推理模型的天價成本和使用費用拉到了新低,持續震撼硅谷。
而英偉達12月底發佈的全新GPU B300,顯存從192GB提升到288GB,足以支持推理模型在處理長序列任務時,其KVCache機制能夠顯著降低延迟,並支持更大的batch size。
這就是老黃為2025年起所有出現的推理模型,提供的物理外援了。
Grok AI繪圖
Part 6:視頻生成
自去年2月OpenAI推出Sora模型引爆視頻生成領域以來,全球範圍內的相關技術突飛猛進。
本輪視頻生成技術進步熱潮中,最受矚目的是兩股技術力量。
其一是將Transformer架構引入到擴散模型中的DiT(Diffusion Transformer)模型,它極強地提高了圖像生成的質量。
代表作是OpenAI的Sora。
另一種的主要路線仍然與深度學習和GAN(生成式對抗網絡)密不可分,它通過分析大量訓練數據,學習並嘗試模擬現實世界的物理規律。
代表作是Google DeepMind的Veo 2。
在這條賽道上,國內相比海外更加百花齊放,創業公司和大廠各顯其能,共同鑽研推動技術發展,部分技術已達到甚至超越Sora的水平。
下面列舉部分玩家及其產品:
創業玩家:海螺(MiniMax)、清影(智譜)、躍問視頻(階躍)、Vidu(生數)、PixVerse(愛詩)
大廠玩家:可靈(快手)、即夢(字節)、萬相(阿里)、混元(騰訊)、SkyReels(崑崙萬維)
此處提及產品,是考慮到國內視頻生成賽道玩家幾乎都走「左手技術推進,右手產品落地」路線。
因此,toC產品用户市場反饋對技術的倒逼,也可以視為視頻生成技術迫切前進乃至革新的重要要素。
Part 7:AI Coding
傳統AI Coding,如GitHub Copilot,底層接入OpenAI的Codex模型,聚焦於單行代碼補全或函數生成。
新一代AI Coding工具,則是通過GPT-4o、Claude 3.5等AI 2.0時代的大模型,實現全棧開發能力。
尤其是藉助Claude 3.5 Sonnet強大的編程能力,誕生了很多AI Coding明星項目。
如Windsurf、Bolt、V0,再如剛剛官宣完成最新1.05億美元B輪融資的Cursor,它就就是去年年中接入Claude 3.5 Sonnet后,才實現了用户量和口碑雙雙爆發。
除了指令微調、代碼專項微調、多任務學習與多目標損失函數等拉昇AI Coding能力的傳統藝能外,Claude 3.5 Sonnet的強代碼能力,還有部分來自於其長上下文能力,有助於模型評估需求並生成量身定製的解決方案。
2025年,AI Coding背后的技術又有了新的探索點。
代碼能力與o1相當且開源的Deepseek-R1,本月20日剛剛發佈。
其AI Coding能力能大幅拉昇,部分基於在極少數標註數據的情況下,后訓練階段純RL(強化學習)路線,無需SFT(監督式微調);在編程任務中,額外使用自動化測試來評估代碼質量。
總之,雖然AI Coding仍需人工干預優化,但已經完成顛覆性變革:
從代碼補全工具躍升爲全流程開發助手,甚至已經從「低代碼」的拖拉拽,進階到讓「無代碼」編程從概念走向實踐。
目前,AI Coding的底層技術已經出現值得深入探索的新側重點,加上基座大模型自身的飛速進展,完全有望在2025實現智能駕駛L3級別的突破,催生出全新的開發範式。
Part 8:空間智能
空間智能這一概念,最早在2024年由斯坦福大學教授、被譽為「AI教母」李飛飛提出:
空間智能是指機器在三維空間和時間中感知、推理和行動的能力,幫助它理解事物在三維空間中的位置及交互方式。
遵循此理念,李飛飛創辦了空間智能公司World Labs。
並於去年12月初發布了首個空間智能模型,1張圖就能生成可交互的3D遊戲世界AI系統,以此真正拉開空間智能從理論邁向實踐的帷幕。
進一步釐清空間智能的細節,其野望在於將空間計算操控虛擬世界的本領和具⾝智能觸達現實世界的能⼒結合起來。
故而,具身智能、世界模型、3D生成也可涵蓋在廣義空間智能背后技術範圍內。
其中,世界模型旨在構建對物理世界的動態模擬,支持AI系統預測未來狀態並制定行動策略。
截至目前,該領域呈現兩大技術路線:
第一,以谷歌Genie 2為代表,通過視頻生成模型學習物理規律,能夠從單幀圖像預測連續動作序列;第二,以英偉達Cosmos為代表,結合強化學習與多模態數據,構建高精度虛擬環境。
3D生成技術則是空間智能的另一個發展方向。
其下又分基於3D Gaussian Splatting、利用2D Diffusion Model優化3D幾何、通過Transformer直接映射2D圖像到3D表徵等多種技術路線。
One More Thing
在這8大賽道中,有的蓄勢待發,有的已露崢嶸,有的甚至呈現「超車」之勢。
無論是產品側的「看得見」,還是技術側的「摸得着」,AI正以前所未有的速度重塑着我們的生活。
整理盤點過程中,難免百密一疏。
若有掛一漏萬之處,還請諸位海涵,也歡迎小夥伴們在評論區指出和探討。
最后,祝大家新春快樂發大財,咱也要趕春運回家過年去liao~
(聲明:本文僅代表作者觀點,不代表新浪網立場。)