繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

基模「驅虎」,阿里「吞狼」

2025-09-04 10:48

原標題:基模「驅虎」,阿里「吞狼」

今年7月,彭博社對阿里雲創始人王堅進行了一次訪談,當時王堅還有另一重身份,之江實驗室主任。 

之江實驗室是浙江省為基礎技術研究和攻關建設的前沿陣地,2021年被納入了國家實驗室體系,作為繼雲計算之后的又一項進入社會議題的重要基礎技術,人工智能自然也在之江實驗室研究之列。

曾經,王堅是國內最 大一朵雲——阿里雲的締造者,如今,王堅再次站到了人工智能技術漩渦中央,本質上是當代「工業革命」,或者説是技術革命的一次延續。

在彭博社的那場訪談中,王堅有這樣一段話描述了雲與AI的關係:

「因為互聯網的存在,我確信雲計算是一項好業務,而互聯網將數據聚集到一起,也讓我堅信,數據會從根本上改變商業模式。

但我當時沒有意識到的是,計算、數據、模型結合在一起會創造出人工智能,會再次改變我們做生意的方式,也沒有想到,人工智能會成為雲計算最 大的‘客户’。」

當然,王堅更不會想到的是,它年之后,人工智能會在短短几天內為阿里雲帶來3600億市值。

基模「驅虎」

2019年3月27日,2018年圖靈獎名單公佈,在這一屆圖靈獎得主中,最引人注目的是「深度學習三巨頭」——傑弗里·辛頓、約書亞·本吉奧和楊立昆。

這老三位有着錯綜複雜的關係,又各有各的故事。

辛頓的人工智能技術成果曾在2013年以4400萬美元的高價競拍給了谷歌,辛頓也隨之一起投效了谷歌,當時參與這場競拍的還有微軟、百度。

后知后覺的Meta后來是三顧茅廬請了楊立昆出山,來為Meta的人工智能戰略坐鎮。

學術大佬的坐鎮對於科技巨頭有諸多好處,諸如這些學術大佬手中技術成果商業轉化的優先權,以及這些學術大佬的名氣和人脈帶來的人才資源。

當然,由於在美國這些科技巨頭中擁有至高話語權,這些學術大佬往往也會將自己的學術習慣帶到公司中,楊立昆為Meta帶來的一個「學術習慣」是,開源。

2022年11月30日,ChatGPT的問世將人工智能拉入了大模型範式,也讓人工智能進入到了OpenAI時刻。

我們如果看那一年美國人工智能領域格局的話會發現:

OpenAI一騎絕塵,投資了OpenAI的微軟成了最 大的贏家,谷歌依舊是美國頂 級科學家的大本營,而且還是Transformer架構的提出者。

那麼,當時同爲美國頂 級科技公司的Meta要如何應對?

在楊立昆的影響下,Meta在人工智能領域走了另一條技術路線,開源路線。

2023年2月,Meta發佈了自己的Llama 1,這是Meta發佈的第 一個大模型,一個開源大模型。

在大模型成為人工智能主流技術範式后,通用基礎大模型,也就是大家常説的基模,形成了以OpenAI為代表的閉源路線和以Meta為代表的開源路線兩條技術路徑。

在國內,承襲了開源技術路線的是阿里。

2023年8月,阿里首次對外發布兩款開源大模型QWen-7B和QWen-7B-Chat,通過小參數模型,阿里開始試水大模型開源路線。

實際上,當2023年大模型這把火燒到國內時,最 先感知到它的存在的是兩個羣體:

一個是李志飛、王小川、李開復等科技領域創業大佬,另一個就是國內互聯網巨頭。

前者支撐起了2023年國內的百模大戰,后者則成了這場百模大戰的最終受益者。

國內在2023年最早發聲、也是勢頭最猛的互聯網巨頭公司有兩家:

一家是在2013年收購辛頓DNNresearch未果的百度,百度后來在國內廣泛招攬AI人才,在2014年重組深度學習研究院為百度研究院,確立了AI戰略。

2023年3月16日,百度召開新聞發佈會,發佈了文心一言,百度CEO李彥宏自豪地稱,「百度是全球大廠中第 一個發佈大模型的廠商。」

只不過,卡點發布的文心一言並沒能如眾人所願那般對標上ChatGPT,乃至在之后的一年里,國內人工智能領域的一個普遍觀點是,國內大模型的技術進程較ChatGPT至少落后1-2年。

另一家是后來走了開源路線的阿里。

同樣是在2023年就發佈了大模型的阿里,雖然其產品通義千問對外發布時間比百度晚了一個月,但卻成了后來國內發展最猛,也是最有可能追上OpenAI的團隊。

實際上,互聯網巨頭在技術領域往往秉持的是廣撒網模式,國內幾家大廠的實驗室中其實早早就有在跟進大模型這條技術路徑,也早早就有了技術雛形,只是大家不確定該All in哪條路線,以及人工智能何時到來。

話分兩頭,一頭是國內掀起了百模大戰,尤其是在基模領域追趕ChatGPT,成了2023年中國科技領域的重頭戲。

這一年,無論是大模型明星創業團隊,還是互聯網巨頭,在產品發佈會上大都會提到或被問到——團隊與ChatGPT的技術差距有多久?

這場持續了近兩年的百模大戰第 一階段最終以「大廠做基模、創業做應用」的暫定格局收尾,其中標誌性事件是零一萬物部分團隊併入阿里,李開復公開表示,「只有大公司能繼續做超大模型(教師模型)。」

「AI六小虎」黯然失色,基模進入到了互聯網巨頭掰手腕階段。

另一頭是互聯網巨頭的基模不斷刷榜后,開始挺進商業世界。

阿里的開源大模型是在Qwen2.5、尤其是2025年1月的Qwen2.5 Max發佈后,開始在產業中體現出商業價值。

押注AI,像押注雲計算一樣

2024年是中國大模型發展最快的一年,也是燒錢最快的一年。

阿里現任掌舵人吳泳銘在近日的財報電話會上透露,阿里過去四個季度在AI基礎設施和AI產品研發上的累計投入已經超過1000億元。

由此帶來的是,阿里在國內人工智能領域的一騎絕塵。

就業務從屬關係來看,阿里將大模型產品放到了與之高度相關的雲業務體系中,這其中一個關鍵考量自然是大模型產品的應用與雲計算資源消耗高度掛鉤,「賣大模型就是賣token」已經成為一個主流觀念。

尤其是在吳泳銘接棒阿里CEO的2023年,為阿里雲定調「AI驅動、公共雲優先」戰略后,阿里雲開始向AI雲轉變。

以最為關鍵的基模模型能力來看,在2024年雲棲大會上發佈的Qwen2.5 72B開源大模型,部分性能已經超越了Meta同期發佈的Llama 3.1 405B大模型,這款大模型也被周靖人稱為「最強開源模型」。

如果説阿里雲2023年發佈7B參數開源大模型是試水技術路線,那麼,自Qwen2開始發佈72B參數規模的大模型,阿里雲就已經堅定要走開源路線,並通過大量人才、資金的研發投入,很快走在了全球前列。

據阿里官方給出的統計數據顯示,截至2025年4月,阿里通義系列開源模型超300個,全球下載量超3億次,基於Qwen系列衍生模型超10萬個。

與此同時,阿里雲還上線了用於模型訓練和部署的人工智能平臺PAI、用於企業級大模型開發的百鍊平臺,搭建了用於訓練模型的十萬卡級靈駿智算集羣,研發了用於模型推理的平頭哥系列芯片……

后來阿里雲一再強調打造了全棧AI體系,芯片、算力集羣、平臺工具、通用基礎大模型,正是其中關鍵的幾個環節。

至於資金投入上,2024年國內大模型領域還上演了一場別具特色的價格戰,字節、阿里、百度、騰訊、科大訊飛等基模公司都有參與到這場大戰中。

阿里雲的大模型在2024年至少經歷了三輪集中降價,在2024年12月31日公佈的第三輪降價中,通義千問視覺模型全線降價超80%。

關於降價,阿里雲CTO周靖人在2024年9月的一次採訪中曾專門做出過迴應:

「今天大模型的創新、迭代和運用依然處於早期階段,如果推理成本昂貴,大量開發者就無法有效、規模化使用大模型,大模型的能力需要讓大家用得起……

……我不認為這是價格戰,我們的大模型降價主要通過技術優化來實現,通過規模效應、技術進步和資源調度將成本進一步降低……」

后來行業中有過這樣統計數據:

在經過2024年幾輪降價后,大模型的調用成本下降了99%,百萬Token調用成本直接降到了不到1元。

大模型基模的技術衝刺、成本猛降的成效最終在阿里雲業務上有了很好的體現,吳媽在2025財年年報中指出,阿里雲公共雲收入增長加速、AI相關產品收入連續七個季度實現了三位數增長,全財年收入實現了雙位數增長。

而轉年進入2025年、大模型應用落地元年后,阿里雲再次加快了推進AI戰略的腳步,我們能夠看到的是:

曾經幫助阿里推廣了雲計算的阿里雲城市峰會,在這一年轉變為AI勢能大會,開始在各個城市推廣阿里雲的全棧AI、大模型能力,以及已經打造出的阿里雲大模型應用標杆企業的標杆案例;

更為直觀的是,曾經朗朗上口的「上雲就上阿里雲」的廣告詞,在這一年也化身為「AI就用阿里雲」,出現在了各大機場最顯現的位置。

阿里雲押注AI的決心,就像十年前押注雲計算一樣。

只不過,這次,所有人都相信AI的未來,AI的競爭從第 一天就是熾熱戰場。

3600億的「彩頭」

9月3日,Anthropic官宣完成130億美元F輪融資,投后估值1830億美元(約1.3萬億元),全球人工智能領域由此迎來了第三家萬億估值獨角獸公司。

Anthropic是由OpenAI前員工在2021年創立,和OpenAI並稱為全球基模領域兩大AI獨角獸公司。 

或許有人會覺得遺憾,國內經過百模大戰后,也未能跑出一家像上述兩家一般的基模創業公司,基模最終仍是被互聯網巨頭秋風掃落葉后收入囊中。

實際上,這本質上是兩個創業環境培養出的不同創業體系——美國往往是在基礎技術上一騎絕塵,中國的創業團隊更擅長的是應用創新。

如果將人工智能視為堪比互聯網的跨時代技術周期,在人工智能被寫入政府工作報告、成為國家戰略級新興產業后,國內人工智能產業基本由深層到淺層可以按數據、算法、應用被劃歸為三大環節,這其中: 

最根本的數據構成的數據網,更像是互聯網時代由三大運營商運營的互聯網,由新成立的數據集團統一管理,北京數據集團就在2025年7月正式成立;

最基礎的通用基礎大模型,更像是互聯網時代的門户網站,最終會由幾家人工智能巨頭提供,顯然,阿里雲正在從互聯網巨頭過渡到人工智能巨頭;

最廣泛的人工智能應用,更像是互聯網時代各種門類的App,這正是中國創業團隊擅長的地方,各種智能體正在中國市場孵化中。

作為人工智能這個大時代中商業帝國的根本,如今的一個行業共識是:

通用基礎模型已經足夠支撐第 一波商業化應用落地,我們正在進入一個由通用基礎模型「教」出的小參數模型支撐各類智能硬件、催生智能體和智能應用的階段。

也是在這時,作為國內通用基礎模型的代表,阿里在全球的估值也迎來了一次急劇拉昇。

在阿里2025年財報發佈后,阿里股價一度飆升19%,港股市值由此飆升超4000億港元(約3600億元)。

就連外媒都為此咂舌不已。

不過,3600億也只不過是中國人工智能產業發展的一個彩頭。

一則是,人工智能應用、智能體創業大潮剛剛開啟,超級AI應用還在醖釀之中,大模型第 一階段商業大幕才僅僅掀開一角,由基礎模型帶來的商業價值更多停留在提振雲計算、消費token上; 

二則是,從數據集團的成立、《人工智能生成合成內容標識辦法》落地來看,我們仍處於人工智能基礎設施構建和完善階段,甚至包括通用基礎模型,依然處於不斷完善階段。

在今年接受彭博社採訪時,王堅就指出,「AI競賽是一場馬拉松,我們肯定還處於早期階段。」

甚至,王堅「並不認為在AI領域,如今擁有的任何優勢,會成為別人無法追上的障礙。」

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。