熱門資訊> 正文
2026-05-22 08:26
自2007年那聲發令槍響,一晃,中國雲計算已狂奔十九年。
倏忽歲月,雲已漫天。
如今,第五次變局的號角,再次吹響。
19年來, 從硬件虛擬化、平臺化、雲原生,再到AI融合,不誇張的講,雲計算是中國互聯網搭建全域統一算力底座、完成數字底層技術架構定型的核心根基。
同時,雲計算也重塑了中國互聯網數字資源的存在形態與價值流轉底層邏輯,推動中國互聯網從消費流量時代全面邁入產業數字化時代。
從成本節約到效率提升,從應用創新到業務賦能,在大模型如火如荼發展的今天,雲計算的身份又完成了一次價值躍遷——走向價值創造。
從IaaS到PaaS,從XaaS到MaaS/AIaaS,在2026年中國雲計算廠商集體又一次默契的找到了產業共識——Agent Infra成為核心戰略定位。
Q2以來,雲廠商「第五戰役」的號角此起彼伏。
5月13日,百度集團創始人李彥宏提出DAA成為AI時代的度量衡,而非DAU。智能體作為第二代入口,其價值天花板遠高於聊天機器人。同時他還提出了AI時代「自我進化」的三個層次,Agent的自進化是其中一個關鍵層面。
一周后,剛剛結束的2026阿里雲峰會上,阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光更是直言「雲基礎設施是Agentic時代重要的技術基石。」只有全新的雲基礎設施才能滿足Agent運行的穩定、安全、及時調度等多種需求。而其新發布的「千問雲」,更被稱為是「為Agent而生的全新服務方式。」
事實上,在接下來的6月份,騰訊雲、火山引擎等雲廠商也都按捺不住,騰訊雲的 AI產業應用大會、火山引擎Force原動力大會舉辦在即。Agent成為AI另一個增長點,與之緊密相關的基礎設施服務轉型,成為新的「故事」。
過去三年,雲計算的核心是AI Native Cloud,本質是「算力優化」,是圍繞大模型訓練、推理,提供高併發、大吞吐、低延迟的算力集群,核心指標是集群規模、算力密度、網絡帶寬。
但隨着智能體向更多場景滲入,傳統AI基建已無法適配Agent的原生需求,行業共識認為雲必須從「服務模型」轉向「服務智能體」。「算力利用率」不再是唯一的核心,「智能體任務成功率、執行效率、治理可控性」成為衡量因素。
億歐在此次阿里雲峰會上了解到,目前阿里雲將其拆解為兩層。一是AI native cloud,繼續深耕模型訓練、推理的算力支撐。二是agent native cloud,專為智能體的編排、運行、治理打造基礎設施。
與之相對應的,百度此前是以Agent Infra為核心,提出「芯雲模體」全棧架構,將MaaS升級為Token Factory,核心是讓每一個Token都能高效轉化為可執行的智能動作。
這場轉向的本質,是雲計算服務對象的根本變化:從「為人編寫的軟件」服務,轉向「為自主決策、自動執行的智能體」服務。
傳統雲面向確定性任務,資源長期佔用、負載平穩。而Agent任務具有短生命周期、無規律突發、動態依賴、任務級安全四大特徵——一個智能體可能一秒發起任務、一秒銷燬,也可能7×24小時持續運行,還需頻繁調用數據庫、瀏覽器、第三方工具,這要求雲基建從「資源調度」轉向「任務調度」。
百度創始人李彥宏在2026年Create大會上直言:「Token不一定代表終局,DAA(日活智能體數)纔是AI時代的新度量衡」。過去行業比拼誰燒的Token多、誰的集群大,現在轉向比拼誰能支撐更多智能體穩定干活、交付結果。
阿里雲也提出類似判斷:「我們第一次從規模化管理算力,進入規模化管理智力」。兩大巨頭的共識,宣告了雲計算底層邏輯的徹底重構。
AI Infra的轉向並非偶然,傳統雲計算架構,與Agent的原生需求存在根本性錯配。因此,AI Infra的轉向是智能體走向場景的必須需求。
一方面,「算力時代」傳統資源調度「失效」。智能體工作負載與傳統AI任務、互聯網任務完全不同。其短生命周期,多數Agent任務耗時秒級至分鍾級,用完即銷燬;突發無規律,流量可能瞬間爆發萬倍,也可能長期休眠。且狀態依賴強,需持續記憶上下文、工具調用歷史。多模態交互,頻繁調用文本、圖像、視頻、數據庫等多元工具。
傳統雲基於「長周期部署、平穩負載」設計,無法適配這種「脈衝式、狀態化」負載。比如傳統容器需分鍾級啟動,無法支撐Agent秒級啟停。資源按實例長期計費,無法匹配Agent「短時高負載、長時休眠」的成本需求。阿里雲調研發現,企業自建Agent平臺時,僅容器成本一項就遠超預期。
另一方面是成本與效率的矛盾。大模型推理成本高企,而Agent的多輪調用、上下文重複計算,進一步加劇成本壓力。百度數據顯示,傳統MaaS服務中,約30%的Token用於重複計算,推理效率低下。阿里雲也提到,KVCache命中率不足70%時,推理的內存瓶頸會導致效率暴跌。
同時,企業Agent落地面臨「95%的任務是重複勞動,5%的核心決策」的現狀,傳統基建無法複用歷史計算結果,導致「每一次調用都從頭算」,成本居高不下。百度執行副總裁沈抖指出:「Agent時代,成本不是算力成本,而是Token效率成本」。
此外,安全治理也是繞不過的原因之一,智能體可自主訪問企業核心數據、調用業務系統、執行操作,傳統雲的安全體系(賬號權限、網絡隔離)是「人用軟件」的邏輯,無法適配Agent的身份認證、權限精細化、行為審計、數據泄露防護需求。
比如一個Agent誤刪數據庫、泄露客户數據,傳統安全體系無法追溯責任、實時攔截。此外,多Agent協作時,記憶共享、權限隔離、任務衝突等問題,傳統治理工具完全空白。阿里雲總結企業Agent落地六大核心挑戰,安全與治理佔其三,這也是多數企業「敢Demo、不敢量產」的核心原因。
智能體將重構產業,新基建是入場券。李彥宏此前在百度AI開發者大會上曾預測,未來全球DAA將超100億,每個崗位、每個場景都將有多個Agent承接工作。阿里雲判斷,未來2-3年,Agent將迎來爆發式增長,企業工作流從「以人為中心」全面轉向「以Agent為中心」。
普華永道數據顯示,美國79%的企業已在業務中使用Agent,88%計劃增加投入。Gartner預測,2028年33%的企業軟件將原生集成Agent能力。面對確定性趨勢,雲廠商必須搶先佈局Agent-Native基建,否則將失去下一輪產業競爭的入場券。
阿里雲與百度的轉向路徑高度相似,基於「芯雲模體」的AI全棧能力成為重要方向。
其中,最關鍵的硬件是芯片。智能體對芯片的需求是「高推理性能、低延迟、高併發、低成本」,傳統GPU無法適配,兩大巨頭均發力自研芯片。
阿里雲推出真武M800訓推一體AI芯片,配套ICSwitch互聯芯片,搭載於磐久AL128超節點服務器。據瞭解,該芯片專為Agent推理優化,支持800Gbps高速網絡,單集群可支撐10萬卡規模,萬卡線性擴展效率超96%,重點解決Agent高併發推理、短時高負載的算力需求。
與之相對應的是,百度自研崑崙芯,已迭代至P800,持續交付萬卡級集群,256卡天池超節點將於6月上市,推理效率提升50%。崑崙芯深度適配文心大模型,同時支持DeepSeek、GLM等主流模型,核心是提升Token生產效率,降低Agent調用成本。
除此之外,架構層、產品層以及整體的生態能力都將因為Agent進入更多場景和工作流而產生調整和變化。
值得注意的是,雲廠商的Agent基建轉向,不僅是技術變革,更是產業變革。
其一體現是「成本的下降」。儘管成本的下降還不是當下的直接結果。阿里雲智能集團終端智能計算事業部總裁旭卿在介紹JVSClaw接受媒體採訪時表示:「JVSClaw的上線帶來了B端客户的一些需求,技術團隊能從客户需求中抽象出來一些Agent Infra所需要的能力。因此即使當下‘虧本’做這件事情也是值得的。」
除了成本之外,安全治理可控成為一大優點。Agent身份認證、權限精細化、行為審計、數據隔離等能力,解決企業核心顧慮。阿里雲Agent安全中心可追溯每一個Agent操作,百度AI安全護欄可實時攔截異常行為。
但是當Agent成為市場和行業捕捉到的下一個「爆點」,行業的競爭與「洗牌加速」趨勢顯化。雲廠商從賣算力,轉向賣「智力服務」——Agent編排、記憶管理、任務執行等將成為新的營收增長點。具備全棧能力的巨頭(阿里、百度)搶佔先機,中小云廠商若無法快速跟進,將被邊緣化。垂直領域解決方案商將崛起,聚焦金融、製造、醫療等行業Agent場景。
雲計算的Agent化轉向,本質是技術、產業、資本的三重共振。李彥宏説:「未來比拼的不是算力,而是智力」。而阿里雲認為:「Token要變成智能,智能要變成行動」。
這場變革纔剛剛開始。阿里雲的Agentic Cloud、百度的Agent Infra,只是起點,而非終點。未來,雲廠商的核心競爭力,將不再是集群規模、算力密度,而是支撐海量智能體高效、安全、穩定運行的智力運營能力。
對企業而言,擁抱Agent時代,就是擁抱新的生產力。對雲廠商而言,打贏Agent基建戰爭,才能搶佔下一個十年的產業制高點。從算力到智力,雲計算的下半場,纔剛剛啟幕。
本文來自微信公眾號「億歐網」(ID:i-yiou),作者:劉娟,編輯:劉歡,36氪經授權發佈。