大廠最年輕AI一號位姚順雨交卷：入職騰訊4個月，一邊糾偏一邊降價

2026-04-24 17:52

騰訊控股(00700.HK) 0

圖片來源：時代周報記者攝

入職4個月后，騰訊首席AI科學家姚順雨交出了第一份答卷。

4月23日，騰訊混元發佈Hy3 preview語言模型並將模型開源。據騰訊方面介紹，這是一個快慢思考融合的混合專家模型，總參數295B，激活參數21B，最大支持256K上下文長度。這是混元重建后訓練的第一個模型，在複雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現了大幅提升。

騰訊在AI的佈局和投入節奏一向被人評價為「慢」。在今年1月騰訊年會上，騰訊董事會主席兼首席執行官馬化騰也公開承認，騰訊比友商「慢了9個月到1年時間」。他認為，基礎設施不足，模型迭代頻率偏低以及平臺能力有待提升。

高層的反思無疑加速了騰訊AI的變革。2025年開始，騰訊混元大模型完成了「深度重構」：在人才引進、組織結構等方面做出了重大調整，吸引了更多原生AI領域人才。其中，姚順雨的加入被普遍視作重要拐點。

在被騰訊挖角之前，姚順雨在OpenAI工作過一年，深度參與智能體產品Operator與Deep Research的開發，成為這兩大項目的關鍵貢獻者。憑藉在AI領域的突破性研究，2025年姚順雨還入選《麻省理工科技評論》TR35榜單，成為該獎項中國區最年輕的入選者之一。

爲了吸引姚順雨，騰訊可能提供了國內大模型人才戰中的職位和薪酬的最高標準。曾有市場傳聞稱騰訊爲了挖走他開出了上億元的薪水，騰訊隨后闢謠。但即便這個數字並不真實，1998年出生的姚順雨仍是國內大廠中最年輕的AI一號位。

入職后，姚順雨獲得了前所未有的資源支持。騰訊分散在不同事業群的AI研發業務被重新整合，就連成立10年的騰訊AI Lab也悄然解散，研究能力併入姚順雨的大模型體系。

正因如此，外界對姚順雨在騰訊的舉動高度好奇。這位只有28歲的年輕人，究竟能為騰訊AI帶來何種變化？騰訊AI的未來技術路徑與戰略重心又將走向何方？

希望團隊不要盯着榜單做事

姚順雨入職騰訊之后的一項重要任務是，幫助騰訊找到混元大模型長期表現欠佳的原因。而在姚順雨一番內部調研后發現，混元的評測出現了問題。

據晚點此前報道，姚順雨曾在內部會議上指出，過去的混元模型過度追逐榜單成績，將打榜的語料放入訓練集以致數據被污染，影響了在真實場景中的表現。他希望團隊以后不要打榜，也不要盯着榜單做事。

在2026年1月的一次公開亮相中，姚順雨也曾談及模型「刷榜」。他指出，國內對刷榜或數字看得更重，而DeepSeek做得比較好的一點是，他們可能沒有那麼關注榜單的數字。DeepSeek可能會更注重：第一，什麼是正確的事情；第二，什麼是自己能體驗出好或者不好的。

「這需要大家走出這些榜單的束縛，能夠堅持自己認為正確的過程。」姚順雨説。

姚順雨首先要做的就是改變混元團隊對刷榜的依賴。時代周報記者獲悉，2026年2月，騰訊混元重建了預訓練和強化學習的基礎設施，並提出了三個原則：能力體系化、評測真實性、性價比追求。

騰訊想要以此跳出「刷榜」的怪圈，通過自建題目、人工評測、產品眾測等多種方式，評估和改進模型的「真實戰鬥力」。具體來看，在Hy3 preview中，混元團隊沒有完全依賴行業通用的公開評測集，而是自建了50多個Benchmarks（評測基準，即用來衡量模型真實能力的標準化測試集）來評估模型的實際能力和落地性。

與此同時，姚順雨也在追求模型與騰訊內部業務的貼合，讓模型在實際應用中學習進化。

在上述公開發言中，姚順雨也曾強調，大型科技公司應利用自身龐大的內部場景進行驗證。與初創公司依賴外部標註商不同，一家擁有10萬員工的大廠本身就是巨大的實驗場。

「把真實世界的數據利用好，而不是僅僅依賴於標註商或者外部採購，是更有意思的事情。」姚順雨説。

為此，正式上線之前，Hy3 preview也在騰訊主要AI業務進行了產品測試。比如，混元就與元寶進行了深度協同設計（Co-Design）。一方面，Hy3 preview針對性地提升了模型在意圖理解精準度、文本創作質量、深度搜索等硬核指標上的表現；另一方面，Hy3 preview對文風、文筆、交互情商、內容組織與專業度上進行精細化調優。

在公眾號AI分身和AI客服的場景評測中，Hy3 preview在用户意圖理解、複雜上下文承接和知識信息組織方面的表現也更為成熟。結合知識庫、用户記憶與上下文生成回答時，Hy3 preview更貼合AI分身和AI客服的角色，過度腦補、主觀代入和情緒化表達問題明顯減少。

得益於這些動作，Hy3 preview的實用性有所提升。特別是在Agent、上下文學習、複雜推理和代碼等主推能力上，Hy3 preview的表現已經接近或超越Kimi-K2.5和GLM-5，但相比Gemini-3.1-Pro與GPT-5.4 xhigh仍有一定差距。

姚順雨進一步指出，騰訊將繼續擴大預訓練和強化學習的規模，提升模型的智能上限，並通過與騰訊眾多產品的深度Co-Design，持續提升模型在真實場景中的綜合表現，並開始探索特色模型能力。

成本相比上一代模型大幅下降

除去能力上的變化之外，Hy3 preview的另一項顯著變化在於成本的降低。

據騰訊方面介紹，得益於模型和推理框架上的深度協同，以及在推理框架、算子性能、量化算法等全方面優化，Hy3 preview整體推理效率提升40%，成本相比上一代模型也大幅下降。

在騰訊雲大模型服務平臺TokenHub上，Hy3 preview輸入價格最低1.2元/百萬tokens，緩存命中輸入價格0.4元/百萬tokens，輸出價格最低4元/百萬tokens。同時，騰訊雲還聯合混元推出Hy3 preview Token Plan定製套餐，個人版定價最低每月28元。

這無疑是對「Token經濟」的一次迴應。當OpenClaw成為全民關注點，各大廠商加入「龍蝦潮」，Token的消耗就開始呈現出指數級的增長趨勢。據國家數據局披露，2026年3月中國日均Token調用量已突破140萬億，較2024年初的1000億增長超千倍，較2025年底的100萬億增長40%以上。

自此，一場無聲的「座次重排」已然開啟。流量不再是衡量互聯網公司競爭力的唯一標尺，Token正崛起為新的硬通貨。如何吸引用户消耗更多Token，也隨之成為AI時代競爭的關鍵。

不過，價格只是Token戰爭當中的一環。上海期智研究院研究員李彪曾撰文指出，如果今天仍有人只討論「哪個模型每百萬Token更貴」，這説明只看到了底層供給的一部分。真實情況是，企業目前購買的是一段被組織過的智能勞動，裸模型只是其中的一小部分。它可能同時包含模型推理、搜索、檢索、緩存、上下文駐留、運行時、容器、團隊席位、動作配額，乃至一個被明確定義的「完成件」。

「AI經濟正在經歷的，不是一場簡單的價格戰，而是計費對象的擴散。」李彪寫道。

在這種情況下，只關注Token的消耗，而忽視模型本身的輸出能力和成本效率，客户終將流失。唯有聚焦產品本身，為客户創造切實的價值，才能自然形成真實、可持續的Token消耗。

也正是因此，各家大廠之間，模型能力的競爭仍在不斷升級。今年2月，字節跳動先后發佈了Seed 2.0大語言模型和新一代視頻生成模型Seedance 2.0，此后持續高頻更新；4月，阿里也發佈了Qwen 3.6的多個版本，並認領了近期「屠榜」的神祕視頻生成模型HappyHorse；DeepSeek-V4的預覽版本也已經在4月24日正式上線並同步開源。

此外，對於C端用户的爭奪也在加劇。移動數據調研機構Quest Mobile報告顯示，元寶在一季度新增用户820萬，豆包和千問的增量則分別達到了1億和1.26億。截至2026年3月，國內月活用户規模最大的三個AI App分別是豆包、千問和DeepSeek，豆包的月活用户數量已經達到3.45億；千問月活超越DeepSeek，達到1.66億；元寶則排在第四，月活只有5735萬。

激烈競爭之下，騰訊仍需不斷加速迭代，才能追平因起步慢帶來的差距。正如姚順雨所説，Hy3 preview只是混元大模型重建的第一步。

大廠最年輕AI一號位姚順雨交卷：入職騰訊4個月，一邊糾偏一邊降價

推薦文章

港股周報 | 科指再跌破5000點！騰訊創近一年新低！馬化騰表示上了AI的船后發現「漏水了」

一周財經日曆 | 英偉達、沃爾瑪、百度等下周齊放榜！新主席沃什上任后首份美聯儲會議紀要將出爐

美股機會日報｜通脹壓力爆表+美拒絕伊朗停戰方案，三大期指齊跌，油價一度飆漲3%；「木頭姐」最新持倉出爐！再度減持特斯拉、押注太空概念

一周IPO | 中籤即「吃肉」！樂動機器人、劑泰科技上市首日均漲超120%；翼菲科技孖展認購近1.49萬倍，成港股新「超購王」

上市首日大漲68%！「英偉達挑戰者」Cerebras創下2019年來美國科技公司最大IPO記錄！（附投資分析）

特朗普第一季度進行3,642筆股票交易，打破數十年保密信託慣例

時隔九年再訪華！特朗普攜最強商業天團隨行，美股半導體、存儲、航空等七大板塊或迎來利好

AI算力革命下半場，黃仁勛大筆押注光纖！港美股光通信主線行情爆發，哪些重點標的值得關注？