繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

亞馬遜雲科技「反攻」:投資、投資再投資,從「雲時代」向「AI時代」狂奔

2024-12-31 20:10

21世紀經濟報道記者倪雨晴 西雅圖、深圳報道

硅谷和西雅圖是美國AI的兩大高地,頂尖的AI工程師掀起了一波波浪潮。

OpenAI在硅谷的樓里打開AI魔盒、谷歌的Transformer架構為大模型奠定基礎;一路向北,西雅圖的微軟、亞馬遜正在從「雲時代」往「AI時代」狂奔。

尤其是2024年的亞馬遜雲科技(AWS),營收體量已經接近1000億美元,2024年第三季度的營收同比增長19%。但資本市場是苛刻的,對比微軟Azure等雲服務同期33%的增幅、谷歌雲35%的增幅時,外界依然會詢問AWS增幅不及同行的影響。

對此,AWS CEO Matt Garman在近期接受21世紀經濟報道在內的媒體採訪時談道:「如果你從絕對規模來看,我們的業務仍在增長,AWS的業務仍然領先於並且大於所有其他公司的業務,我們需要繼續專注於客户。」

(亞馬遜雲科技CEOMattGarman)

對於雲市場的競爭,他進一步強調,這個市場規模巨大,它並不是一個「贏家通吃」的行業,這個領域會有多個贏家,「如果你看和我們最接近的競爭對手,比如微軟,他們有些舉措實際上是在將現有業務的市場份額轉移到這個新業務中。因此,並不能進行簡單類比,需要看其他業務和整體情況。」

同時,Matt Garman指出,現在大約80%到90%的工作負載仍然運行在本地,對所有的雲服務競爭者來説,如何將這部分遷移到雲端,目前是最大的機會所在。

而AWS並非從零開始,客户經驗積累是它優勢,「但我們也意識到,必須始終保持飢渴感,必須不斷為客户進行創新。我們需要繼續為客户降低價格、增加新功能,同時也要不斷拓展地理覆蓋範圍。因此,我們絕不會因為今天是最大的雲服務提供商而停下腳步。」Matt Garman説道。

在2024年的re:Invent全球大會上,AWS確實邁出了大步伐,推出Amazon Nova系列基礎模型並強化Amazon SageMaker、Amazon Bedrock和Amazon Q等核心服務;宣佈AI訓練芯片Trainium2實例正式可用,並推出新一代Trainium3。

當前,AWS正在AI產業鏈的各個環節上秣兵歷馬。正如亞馬遜標誌性的球體建築(Amazon Spheres)中繁盛生長的植物,AWS也在構建生成式AI時代熱帶雨林式的新生態。

投資、投資再投資

AI,毫無疑問已經成為AWS、乃至亞馬遜的主題詞。就連卸任CEO的亞馬遜創始人Jeff Bezos(傑夫·貝索斯),也迴歸一線,領導AI工作。

在2024年12月的一場媒體訪談中,傑夫·貝索斯久違地露面,並宣佈自己仍然在亞馬遜,並投入很多時間在亞馬遜,目前參與的工作中95%聚集在人工智能。

同在2024年12月,AWS一年中最重要的re:Invent大會上,亞馬遜CEO Andy Jassy也親自上臺,發佈新款基礎大模型Amazon Nova系列。目前,Nova包括6款大模型,涵蓋語言、圖像生成和視頻生成模型。

此前,AWS已經有Titan模型,現在更多的模型正在路上,不論自家模型還是第三方模型,都將在其AI應用開發平臺Bedrock上提供。

同時,AWS推出的新一代AI芯片Trainium3,將採用3納米工藝製造。而Adobe、Poolside、Databricks、Qualcomm等企業已大規模投入使用Trainium2。

相比2023年圍繞Bedrock和強化英偉達合作,顯然2024年AWS的節奏更快。

談及AWS的生成式AI策略,Matt Garman提到,AWS在生成式AI方面採取了與衆不同的應對方式。

作為在AI領域深耕20多年的企業,AWS早在十年前就推出了SageMaker,幫助客户在雲中構建AI模型。大約兩年前,AWS已着手嘗試生成式AI模型開發,並認為這是一項極具前景的技術。ChatGPT的出現震撼了世界,點燃了人們的想象力,改變了客户對AI的看法。

但是AWS採取了長遠佈局,而非匆忙推出功能。AWS相信生成式AI將成為每個應用程序的核心技術。此外,Matt Garman強調,他們認為不會有單一模型主導市場,考慮到生成式AI高昂的運行成本,AWS選擇構建一個平臺,確保數據隱私與安全內置其中,為企業提供更全面的支持。

2024年AWS確實在AI領域火力全開,投資也更兇猛。

在2024年11月底,AI初創明星Anthropic宣佈與AWS進一步加深合作,同時亞馬遜將新增40億美元投資。這意味着,亞馬遜對Anthropic的總投資達到80億美元。

在2024年三季度業績會上,Andy Jassy還表示,2025年預計花費750億美元在AWS和生成式AI之上。

大筆的資本支持,也反映了AWS要補齊AI板塊的巨大野心。

與此同時,微軟和谷歌等巨頭也在持續投資建設。儘管近日微軟CEO納德拉在採訪中表示算力投資要謹慎,微軟不會輕舉妄動、大肆採買,但是從規模上看依然很可觀。

摩根士丹利(Morgan Stanley)2024年11月發佈的報告顯示,亞馬遜、Google、Meta和微軟2025年的資本支出合計將達到3000億美元左右,2026年將進一步增長至3365億美元,這些支出多數將投入固定資產,例如數據中心和房地產。

其中,摩根士丹利將亞馬遜2025年資本支出預估值調高22%至964億美元,主要是數據中心加碼採購AI GPU與服務器,2026年預估將進一步增長至1050億美元。

從數據中也能看出,亞馬遜正在加速投入,但是生成式AI能否達到如此高的回報,也成為資本市場的拷問。

對於投資回報問題,Matt Garman表示,當前客户案例中已經初現生成式AI的潛力。這並不僅僅是「請為我寫一首關於咖啡杯的俳句」這樣的簡單應用。儘管計算機程序能夠生成這些內容,這種能力雖有趣,但並非能支撐萬億美元市場的想法。如今,AWS已經看到了一些實際案例的出現,比如在醫療領域,一些公司已經利用生成式AI嘗試突破性的研究。

在Matt Garman表看來,儘管許多模型的能力尚不夠強大,工具仍需完善,數據的應用也有待優化,但從投資角度來看,這是一條正確的道路。這些技術正不斷進步,經歷了從第一代到第四代的持續改進。相信這種趨勢將繼續下去,生成式AI將帶來深遠的影響。

「6頁文檔」和芯片路徑

在Matt Garman談完戰略后,西雅圖市中心一家歷史悠久的餐廳Virginia里,AWS副總裁兼傑出工程師James Hamilton向記者講述了AWS Silicon(芯片)的誕生。

James Hamilton在AWS內部也是頗具傳奇色彩的人物,在他往返工作和家庭(一艘輪船)的路上,經常會來到Virginia。用他的話説,AWS Silicon,也就是芯片業務就是在這家餐廳起步的。

「我每周會有2到3次來到Virginia,和初創公司、供應商、客户等人會面,花一個小時詳細瞭解別人的東西。我總能學到一些東西,偶爾我也會有新想法,在這里還遇到了建立AWS硬件部門的夥伴。」James Hamilton説道。

因此,他選擇在Virginia和媒體交流AWS的芯片事業,在十年前,即2013年左右,他提出讓亞馬遜投資芯片,還寫了一份「6頁文檔」(6 page document)。

亞馬遜內部有一個獨特的「6頁紙」(6 pager)文化,包括研發團隊的技術工程師都要寫文檔,文檔從分析客户需求開始入手。而當會議開始時,大家先埋頭讀文檔20分鍾左右,然后再進行提問溝通環節。

James Hamilton回憶道:「那是2013年8月,已經是很久以前的事了。當時AWS的CEO Andy Jassy讓我整理一份文檔,重點是硬件創新,而我們當時是一家軟件公司。他是一個具有前瞻性思維的人,他認為硬件是這個行業的重要組成部分。因此,我寫了這份文檔,並向Jeff Bezos、Andy Jassy以及AWS團隊的管理層進行了展示。」

這份文檔中有兩個基本論點,第一個論點是「規模總是勝出」,高出貨量會推動創新。他以ARM處理器為例,現在每部手機、每臺電視里都有一個ARM處理器,它們無處不在,目前ARM出貨量已超2000億個。

第二個論點是公司需要創新服務器,簡化團隊的工作流程,「我們希望從硬件最底層、從服務器的核心開始進行創新,為客户創造獨特的價值,必須要這麼做。2013年至今,所有的創新和組件都被整合到芯片上。」James Hamilton談道。

AWS計算與網絡副總裁Dave Brown進一步表示,AWS於2017年開始開發第一款生成式AI芯片Inferentia,這也是一款專注於機器學習的芯片,於2019年推出,「我們一直在追求的目標是,幫助客户每花一美元獲得更多性能。這有點像過去的摩爾定律,但摩爾定律基本上在2003年左右就已經失效了,我們都接受了這一點。但AWS定律是新的,它一直在持續發展。」

他還提到,AWS將芯片從流片到數據中心部署的周期縮短至一兩個月,大幅加快了開發進程,幫助客户更快獲得性能提升。以Graviton系列為例:2018年推出第一代,2019年推出第二代,如今第四代芯片已於2024年初發布。AWS大約每18個月推出一款新的Graviton芯片,涵蓋從設計、流片到部署,再到為客户提供服務的完整流程。

此外,AWS還有自研AI訓練芯片Trainium系列,最新的Trainium3基本上所有設計都會圍繞生成式AI。而在芯片層面,繞不開的話題就是和英偉達等芯片巨頭的競爭,當前不論AWS、谷歌、微軟,都已經有自己的芯片業務,大多是用於自家業務,但是AWS的芯片和服務器對外銷售。

談及競爭,Dave Brown迴應道,NVIDIA、Intel和AMD是AWS最緊密的合作伙伴之一,客户在AWS可選擇Intel、AMD或Graviton,每種方案都有不同的優缺點。部分客户選擇Intel或AMD以利用x86架構和成本節約,而另一些客户則傾向於Graviton,因為其可提供約40%的性價比提升。

在AI領域,這種選擇權同樣適用。有些客户偏愛NVIDIA的生態系統,而另一些客户則嘗試AWS的訓練芯片和Inferentia,以實現成本節約並完成更多任務。他還提到,AWS還與Intel合作,使Sapphire Rapids芯片在AWS上的性能提升約18%,AWS與NVIDIA合作推出GB200的集羣,用於訓練大型語言模型和支持DGX Cloud。

而AWS強調最多的就是多方合作降低成本,不論是對自身業務還是客户業務。多位分析師也向21世紀經濟報道記者表示,互聯網巨頭自研芯片多是出於成本和業務發展考慮,目前尤其是在推理市場上,定製化芯片正在和英偉達形成競爭之勢。

在談及AI推理帶來的新需求時,亞馬遜雲科技大中華區產品技術總監王曉野告訴21世紀經濟報道記者:「一方面在模型控制上,智能體調用時模型能力至關重要;另一方面在底層,不僅要優化延迟latency,還有一點值得關注,那就是底層算力中CPU和GPU計算的配比。以前在模型能力優化時,大家多聚焦預訓練階段(此階段GPU使用較多),但如今在優化推理能力時,很多做法是預訓練到一定程度后,在后續一步推理中採用強化學習等方式,並且會根據CPU計算結果來判斷和調整,這必然會使CPU算力比例發生相應變化。」

展望芯片領域的技術趨勢,James Hamilton表示:「過去幾年大多數創新都集中在芯片本身及其如何縮小尺寸方面。現在,我們進入了大規模多芯片封裝的階段。當前關注的重點是,多大規模的多芯片封裝實際可行?我們如何通過光互連技術來提升性能?以及接下來四到五年內,這一領域將會發生什麼變化?我非常確信,這將是未來五年內創新的核心領域。」

雲廠商的「ABCD模型」競賽

雲廠商的競爭如今愈加激烈,或許我們可以用「ABCD模型」來衡量廠商綜合能力的標準。

一位AI資深從業者向21世紀經濟報道記者表示,要在當前階段勝出,一家雲廠商至少需要具備AI(人工智能)、Business(業務)、Cloud(雲計算)、Data(數據)四項能力,成為「全能型選手」,而非僅僅專注於某一領域。

AI作為核心技術框架無疑是整個模型的領頭概念,各家都在不斷發力。但商用的關鍵性常常被忽視。許多公司盲目投資AI,希望通過技術突破業務瓶頸,正確的路徑應是業務優先,通過明確的業務場景推動AI技術的落地。

從當前的競爭來看,業務先行方面,亞馬遜集團電商垂類業務領先,微軟整體增長較快,直接將C端一系列應用遷移上雲。

雲則是基礎能力,根據Gartner的統計,2023年全球基礎設施即服務(IaaS)市場上,亞馬遜在2023年繼續位居IaaS市場第一,微軟、谷歌、阿里巴巴和華為緊隨其后,以39%的市場份額繼續領跑。

而數據是應用AI的關鍵,數據的豐富性和多樣性直接決定了AI訓練和應用的效果。亞馬遜整體有豐富的電商數據優勢,微軟數據類型較為多樣化,谷歌在數據領域同樣表現出色,依託搜索引擎積累的海量數據優勢,但在雲上的表現稍顯一般。

整體而言,AWS的優勢則在於雲的強大能力,集團電商業務垂直領域的基礎紮實,數據也多元,目前它在AI領域投入巨大,補齊相關的短板。對照ABCD四個指標,微軟、谷歌也各有優劣。

展望未來,AI廠商要想真正擴大AI和雲的規模,必須更加依賴業務的驅動,這也是2024年以來業界關注的商業模式話題。

從全球競爭態勢來看,AI市場的競爭仍在加劇。DeepSeek發佈的新一代大語言模型DeepSeek-V3,與全球頂尖大模型比肩,這表明國內AI初創企業正另闢蹊徑,試圖在這場競爭中佔據一席之地。在全球AI排行榜中,OpenAI、谷歌的Gemini、Anthropic等依然佔據領先位置,但新的競爭者不斷涌現,為市場注入了新的活力。

與此同時,基礎設施的能耗問題成為雲廠商發展的新挑戰,換言之,ABCD之外,E所代表的能源(Eenergy)也將成為關鍵因素。

數據顯示,在美國,基礎設施的耗電量目前佔電網總負荷的2%,而未來十年可能上升至6%-7%甚至更多。能源成本和效率已經成為雲廠商無法迴避的問題,影響着基礎設施擴展和AI技術的部署。

Matt Garman表示,高效利用能源是AWS的重要目標之一。雲數據中心相較於傳統本地數據中心,效率更高,利用率更強。然而,過去簡單申請更多電力的時代已經結束,現在需要從長遠角度規劃電力供應,特別是零碳能源的容量問題。AWS將電力規劃延伸至2024年、2030年乃至2040年,着力推動可再生能源項目的擴展。

但風能和太陽能可能不足以滿足未來需求,核能成為重要補充。AWS此前與核電廠達成合作協議,並對小型模塊化反應堆(SMR)進行了大規模投資。這些自包含的反應堆可部署在靠近數據中心的位置,有效減少電力傳輸損耗。儘管SMR的部署或需等到2030年,但AWS對其潛力充滿期待,視其為未來幾十年滿足需求的關鍵機會。

谷歌也宣佈將從SMR 開發商Kairos Power購買電力。微軟也與Constellation Energy合作重啟三哩島核電站,為其數據中心供電。

雲廠商的競爭已從單一領域的比拼轉向多維度的較量,各大廠商在鞏固核心能力的同時,不斷尋求創新路徑以應對全球市場的挑戰和變化。未來,雲廠商的成功不僅依賴技術實力,更需在業務驅動、生態構建和能源規劃上實現突破。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。