熱門資訊> 正文
2026-04-24 17:52
入職4個月后,騰訊首席AI科學家姚順雨交出了第一份答卷。
4月23日,騰訊混元發佈Hy3 preview語言模型並將模型開源。據騰訊方面介紹,這是一個快慢思考融合的混合專家模型,總參數295B,激活參數21B,最大支持256K上下文長度。這是混元重建后訓練的第一個模型,在複雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現了大幅提升。
騰訊在AI的佈局和投入節奏一向被人評價為「慢」。在今年1月騰訊年會上,騰訊董事會主席兼首席執行官馬化騰也公開承認,騰訊比友商「慢了9個月到1年時間」。他認為,基礎設施不足,模型迭代頻率偏低以及平臺能力有待提升。
高層的反思無疑加速了騰訊AI的變革。2025年開始,騰訊混元大模型完成了「深度重構」:在人才引進、組織結構等方面做出了重大調整,吸引了更多原生AI領域人才。其中,姚順雨的加入被普遍視作重要拐點。
在被騰訊挖角之前,姚順雨在OpenAI工作過一年,深度參與智能體產品Operator與Deep Research的開發,成為這兩大項目的關鍵貢獻者。憑藉在AI領域的突破性研究,2025年姚順雨還入選《麻省理工科技評論》TR35榜單,成為該獎項中國區最年輕的入選者之一。
爲了吸引姚順雨,騰訊可能提供了國內大模型人才戰中的職位和薪酬的最高標準。曾有市場傳聞稱騰訊爲了挖走他開出了上億元的薪水,騰訊隨后闢謠。但即便這個數字並不真實,1998年出生的姚順雨仍是國內大廠中最年輕的AI一號位。
入職后,姚順雨獲得了前所未有的資源支持。騰訊分散在不同事業群的AI研發業務被重新整合,就連成立10年的騰訊AI Lab也悄然解散,研究能力併入姚順雨的大模型體系。
正因如此,外界對姚順雨在騰訊的舉動高度好奇。這位只有28歲的年輕人,究竟能為騰訊AI帶來何種變化?騰訊AI的未來技術路徑與戰略重心又將走向何方?
希望團隊不要盯着榜單做事
姚順雨入職騰訊之后的一項重要任務是,幫助騰訊找到混元大模型長期表現欠佳的原因。而在姚順雨一番內部調研后發現,混元的評測出現了問題。
據晚點此前報道,姚順雨曾在內部會議上指出,過去的混元模型過度追逐榜單成績,將打榜的語料放入訓練集以致數據被污染,影響了在真實場景中的表現。他希望團隊以后不要打榜,也不要盯着榜單做事。
在2026年1月的一次公開亮相中,姚順雨也曾談及模型「刷榜」。他指出,國內對刷榜或數字看得更重,而DeepSeek做得比較好的一點是,他們可能沒有那麼關注榜單的數字。DeepSeek可能會更注重:第一,什麼是正確的事情;第二,什麼是自己能體驗出好或者不好的。
「這需要大家走出這些榜單的束縛,能夠堅持自己認為正確的過程。」姚順雨説。
姚順雨首先要做的就是改變混元團隊對刷榜的依賴。時代周報記者獲悉,2026年2月,騰訊混元重建了預訓練和強化學習的基礎設施,並提出了三個原則:能力體系化、評測真實性、性價比追求。
騰訊想要以此跳出「刷榜」的怪圈,通過自建題目、人工評測、產品眾測等多種方式,評估和改進模型的「真實戰鬥力」。具體來看,在Hy3 preview中,混元團隊沒有完全依賴行業通用的公開評測集,而是自建了50多個Benchmarks(評測基準,即用來衡量模型真實能力的標準化測試集)來評估模型的實際能力和落地性。
與此同時,姚順雨也在追求模型與騰訊內部業務的貼合,讓模型在實際應用中學習進化。
在上述公開發言中,姚順雨也曾強調,大型科技公司應利用自身龐大的內部場景進行驗證。與初創公司依賴外部標註商不同,一家擁有10萬員工的大廠本身就是巨大的實驗場。
「把真實世界的數據利用好,而不是僅僅依賴於標註商或者外部採購,是更有意思的事情。」姚順雨説。
為此,正式上線之前,Hy3 preview也在騰訊主要AI業務進行了產品測試。比如,混元就與元寶進行了深度協同設計(Co-Design)。一方面,Hy3 preview針對性地提升了模型在意圖理解精準度、文本創作質量、深度搜索等硬核指標上的表現;另一方面,Hy3 preview對文風、文筆、交互情商、內容組織與專業度上進行精細化調優。
在公眾號AI分身和AI客服的場景評測中,Hy3 preview在用户意圖理解、複雜上下文承接和知識信息組織方面的表現也更為成熟。結合知識庫、用户記憶與上下文生成回答時,Hy3 preview更貼合AI分身和AI客服的角色,過度腦補、主觀代入和情緒化表達問題明顯減少。
得益於這些動作,Hy3 preview的實用性有所提升。特別是在Agent、上下文學習、複雜推理和代碼等主推能力上,Hy3 preview的表現已經接近或超越Kimi-K2.5和GLM-5,但相比Gemini-3.1-Pro與GPT-5.4 xhigh仍有一定差距。
姚順雨進一步指出,騰訊將繼續擴大預訓練和強化學習的規模,提升模型的智能上限,並通過與騰訊眾多產品的深度Co-Design,持續提升模型在真實場景中的綜合表現,並開始探索特色模型能力。
成本相比上一代模型大幅下降
除去能力上的變化之外,Hy3 preview的另一項顯著變化在於成本的降低。
據騰訊方面介紹,得益於模型和推理框架上的深度協同,以及在推理框架、算子性能、量化算法等全方面優化,Hy3 preview整體推理效率提升40%,成本相比上一代模型也大幅下降。
在騰訊雲大模型服務平臺TokenHub上,Hy3 preview輸入價格最低1.2元/百萬tokens,緩存命中輸入價格0.4元/百萬tokens,輸出價格最低4元/百萬tokens。同時,騰訊雲還聯合混元推出Hy3 preview Token Plan定製套餐,個人版定價最低每月28元。
這無疑是對「Token經濟」的一次迴應。當OpenClaw成為全民關注點,各大廠商加入「龍蝦潮」,Token的消耗就開始呈現出指數級的增長趨勢。據國家數據局披露,2026年3月中國日均Token調用量已突破140萬億,較2024年初的1000億增長超千倍,較2025年底的100萬億增長40%以上。
自此,一場無聲的「座次重排」已然開啟。流量不再是衡量互聯網公司競爭力的唯一標尺,Token正崛起為新的硬通貨。如何吸引用户消耗更多Token,也隨之成為AI時代競爭的關鍵。
不過,價格只是Token戰爭當中的一環。上海期智研究院研究員李彪曾撰文指出,如果今天仍有人只討論「哪個模型每百萬Token更貴」,這説明只看到了底層供給的一部分。真實情況是,企業目前購買的是一段被組織過的智能勞動,裸模型只是其中的一小部分。它可能同時包含模型推理、搜索、檢索、緩存、上下文駐留、運行時、容器、團隊席位、動作配額,乃至一個被明確定義的「完成件」。
「AI經濟正在經歷的,不是一場簡單的價格戰,而是計費對象的擴散。」李彪寫道。
在這種情況下,只關注Token的消耗,而忽視模型本身的輸出能力和成本效率,客户終將流失。唯有聚焦產品本身,為客户創造切實的價值,才能自然形成真實、可持續的Token消耗。
也正是因此,各家大廠之間,模型能力的競爭仍在不斷升級。今年2月,字節跳動先后發佈了Seed 2.0大語言模型和新一代視頻生成模型Seedance 2.0,此后持續高頻更新;4月,阿里也發佈了Qwen 3.6的多個版本,並認領了近期「屠榜」的神祕視頻生成模型HappyHorse;DeepSeek-V4的預覽版本也已經在4月24日正式上線並同步開源。
此外,對於C端用户的爭奪也在加劇。移動數據調研機構Quest Mobile報告顯示,元寶在一季度新增用户820萬,豆包和千問的增量則分別達到了1億和1.26億。截至2026年3月,國內月活用户規模最大的三個AI App分別是豆包、千問和DeepSeek,豆包的月活用户數量已經達到3.45億;千問月活超越DeepSeek,達到1.66億;元寶則排在第四,月活只有5735萬。
激烈競爭之下,騰訊仍需不斷加速迭代,才能追平因起步慢帶來的差距。正如姚順雨所説,Hy3 preview只是混元大模型重建的第一步。