熱門資訊> 正文
2026-02-07 10:20
前不久,在斯坦福商學院的《View From The Top》講座上,阿里巴巴董事會主席蔡崇信坐在臺上,説:
我們在 2019 年就開始做 Transformer 模型了,但沒有跟上。
2019年,阿里已經將 Transformer 用於推薦系統。那是 ChatGPT 發佈的三年前。技術團隊看到了方向,但大語言模型的研發沒能獲得足夠資源。直到 2023 年,通義千問正式發佈,阿里纔算真正進入這場戰役。
三年窗口期,就這樣錯過了。
蔡崇信的解釋是:我們當時沒有分配足夠的資源,因為行業內部也沒有共識這是不是對的方向。
這句話説的不只是阿里。它説的是所有大公司在面對 AI 時的共同處境:一項顛覆性技術在早期階段,看不到短期 ROI。而組織的預算流程、人事考覈、業務優先級,整套系統的慣性會告訴你:別在不確定的方向上押注太多。
所以即使技術團隊看到了方向,資源也未必能跟上。
但蔡崇信在 2023 年復出擔任董事會主席后,給出了自己的答案。他聚焦了三個關鍵詞:
採用、規模、開源。
這篇文章,就是圍繞這三個關鍵詞,覆盤他對 AI 這場仗的思考。
先説第一個關鍵詞:採用。
蔡崇信在講座里反覆強調一個問題:AI 要在什麼場景下被使用,才能真正產生價值。
1、從模型到應用:通義 App 不只是入口
在阿里的 AI 戰略里,通義App是一個重要環節。蔡崇信認為:做 AI 不是隻做模型就夠了。消費者應用、大語言模型、基礎設施,這三層都同等重要。每一層都要投入資本。
從這個角度看,通義 App 承擔的不只是用户入口,更是驗證整個 AI 能力能否在真實場景中落地的關鍵一環:
C 端用户會不會頻繁打開?
B端系統能不能穩定接入?
教育、醫療、電商這些場景能不能真正用起來?
沒有這一層的驗證,模型再強也只是玩具。
2、國內消費市場的特殊性
蔡崇信還提到了中國市場的一個關鍵差異:企業級軟件付費習慣在中國遠不如美國成熟。在中國,讓用户為 API 調用付費的接受度要低得多,推廣難度也遠高於美國。
這意味着:
美國 AI 公司可以靠 API 收入做模型閉環;
而中國模型廠商必須找到其他路徑,靠雲基礎設施,或者靠應用層。
所以通義 App 是阿里探索如何讓模型在中國市場真正被採用的一次關鍵嘗試。只有模型被真實用起來,它才真正產生價值。
就在昨天(2月6日),通義千問啟動「春節30億免單」活動,上線 9 小時 AI 訂單突破 1000 萬單。巨大的流量讓系統一度崩潰,30 多萬家線下門店同時爆單。這場活動的火爆場面,恰恰驗證了蔡崇信的核心觀點:AI 的真正考驗不在實驗室,而在真實用户每一次提問、每一次下單的時候,基礎設施撐不撐得住。
如果説採用決定模型能不能走出實驗室,規模決定它能不能真正進入社會。
蔡崇信在講座中提到:
今天的 AI 投資,正在從訓練轉向推理。所有的超大型公司都在加倍投放資金。
此前,美國大型科技公司每家每年的資本支出在 600 到 800 億美元,如今這個數字已經漲到 1200 到 1500 億美元。這標誌着行業共識的轉變:推理纔是 AI 成本的真正大頭。
1、推理,纔是AI成本的主戰場
在 ChatGPT 剛火的 2022-2023年,大家都把注意力放在訓練:模型參數有多少?訓練成本多高?在 benchmark 上能不能超過 GPT-4?
但蔡崇信指出:訓練只發生在少數公司內部,推理纔是所有人每天都會用到的功能。
用户用通義 App 提問,是推理;
企業用 Qwen 模型處理客服,是推理;
內容生成、數據分析、客户服務場景用模型協助任務,還是推理。
這些都在不斷消耗 GPU、消耗電力、消耗網絡資源。而且不像訓練只需要一次,推理是每天都要執行的。
2、大模型不是拼速度,是拼吞吐量
一個模型能不能接入億級用户、千種任務,取決於幾個實際問題:
能不能在高併發下保持穩定?
推理速度有沒有卡頓?
成本會不會失控?
這纔是規模的真實定義。不是做一個最強模型,而是做一個吞吐量最高、最穩定的模型體系。
阿里為此的選擇是:把模型部署在自家雲上,讓推理性能、吞吐量、併發處理能力全部可控。通義開源模型全球下載量達數億次,背后靠的不只是算法,還有基礎設施。
但規模化的挑戰不止於此。隨着 AI 走向多模態時代,語音、圖像、視頻都要生成,算力壓力只會越來越大。蔡崇信看到的趨勢是:人們不會少看短視頻,只會越來越多,對算力的需求也就沒有天花板。
而當推理需求進入億級用户時代,規模拼的不是性能,是錢:
你的基礎設施能不能調度這麼多 GPU?
能不能在高負載下不崩?
成本控不控得住?
這就是資本支出轉向推理的原因:AI 的落地,拼的不是模型能力的突破,而是基礎設施能不能支撐更多人用。
要讓更多人用得起、用得上,蔡崇信給出的答案是:開源。
開源在 2026 年已經不是新鮮概念。但中國模型公司走向開源的原因,不是技術理想主義,而是商業模式和市場環境共同作用的結果。
純 API 訂閲模式在中國難以規模化,這推動中國模型公司探索新路徑。開源成為核心策略,但它的價值不只是解決盈利難題。
1、第一層價值:自主可控
蔡崇信明確表示,開源的最大價值不是便宜,而是主權。
對企業來説,能把模型部署在自家服務器上;
對政府來説,能本地運行、隔離數據;
對開發者來説,可以自定義微調、添加指令。
他在講座中強調:
「使用開源模型,你可以部署在自己的基礎設施上,可以在本地運行,也可以在私有云環境中運行。無論是后續訓練還是推理,都不再依賴原模型開發者。實際上,你對這個模型擁有完全的控制權和主權。」
這句話背后,體現的是一個AI 競爭新原則:能力重要,但自主可控更重要。
2、第二層問題:開源之后,怎麼盈利?
開源不能只靠下載量,也不能靠社區氛圍。
真正的收入要靠模型在什麼地方運行,誰掌握推理的基礎設施,誰就掌握了盈利的入口。
正是基於這個邏輯,阿里的做法是:把通義千問開源,但引導用户在阿里雲上訓練和推理。模型免費,基礎設施收費。
這個模式能成立,前提是阿里有云業務。因為有云業務託底,通義千問才能放心開源,成為全球下載量最高的中文模型之一。而用户在使用模型的過程中,自然會產生對雲基礎設施的需求,這就形成了商業閉環。
蔡崇信也坦言,這種路徑對很多沒有云基礎設施的公司來説,是無法複製的。
所以,中國模型公司的開源路徑,既是商業現實的選擇,也是用開源模型佔領市場、用雲基礎設施賺錢的策略。
從 2019 年將 Transformer 用於推薦系統,到通義千問成為全球下載量最高的開源中文模型之一,阿里在 AI 上起步不算晚。
但蔡崇信覆盤時沒有強調自己做得早,反而點出了一個更關鍵的現實:起步早不是優勢,能用起來纔是。
採用、規模、開源,這三個關鍵詞都在回答同一個問題:AI 模型怎麼才能真正落地?
AI 不是發佈出來的,是在真實業務里用出來的。誰能把這個閉環跑通,誰就掌握了主動權。
📮 原文鏈接:
https://www.youtube.com/watch?v=MEfO09kPf-w&t=598s
https://www.youtube.com/watch?v=dbV1sMfv9TQ&t=1s
https://www.alibabagroup.com/ir-financial-reports-quarterly-results?utm_source=chatgpt.com
https://www.businessinsider.com/alibaba-joe-tsai-ai-race-us-china-winner-adoption-integration-2025-10
來源:官方媒體/網絡新聞,
本文來自微信公眾號「AI 深度研究員」,作者:AI深度研究員,36氪經授權發佈。