熱門資訊> 正文
2025-09-21 13:24
(來源:機器之心)
大廠之間不是「你挖我」,就是「我挖你」。
那邊特斯拉 Optimus AI 團隊負責人 Ashish Kumar 被挖去 Meta,這邊谷歌 DeepMind 資深研究科學家被 xAI 挖走了。
馬斯克發推祝賀,並用火箭符號喊話:「起飛啦」!
此次,被挖去 xAI 的是一名在谷歌 DeepMind 工作近 9 年的大神級人物 ——Dustin Tran,離職前擔任資深首席研究員。
他是谷歌 Gemini-0801 的共同創造者,這是谷歌首個在 LMSYS 上登頂的模型。同時是 Gemini 2.5 系列模型的評測專家,這些模型在 WebDev Arena 和 HLE 等榜單上取得了第一名。他還是谷歌 Gemini 1、1.5、2 和 2.5 的核心貢獻者之一,其工作涵蓋了強化學習、評測與數據等基礎環節,並共同主導了相關論文與成果發佈。
他在 X 上發表了一篇公開離職信,全文如下:
我在谷歌 DeepMind 工作 8 年多后選擇了離開。這里留下了許多美好的回憶,最初在 Google Brain 參與早期奠基性的論文,與 Noam Shazeer、Ashish Vaswani、Lukasz Kaiser 合作完成 Image Transformer、Tensor2Tensor、Mesh TensorFlow。
后來主導 Gemini 的后訓練評測,在 100 天內完成追趕併成功發佈,帶領團隊登上 LMArena 榜首,並保持了一年多;最后參與 Gemini 在推理方面的突破性創新,與 Heng-Tze Cheng、Quoc Le 合作在 IMO 與 ICPC 中奪得金牌。
Gemini 的旅程是一場從一個範式到另一個範式的狂野轉變。一開始,我們重塑了 LaMDA 模型(第一個類指令的聊天機器人),從一個簡單的對話機器人進化到能夠通過 RLHF 生成長篇、有內容的回答;接着,通過在長鏈思維、全新環境和獎勵頭上的訓練,推動推理與深度思考的能力。剛開始時,外界的輿論非常糟糕,幾乎所有人都覺得谷歌會因為搜索的歷史包袱和組織政治而註定失敗。
如今,Gemini 在用户偏好上穩定佔據第一,並引領新的科學突破。大家又覺得谷歌獲勝是理所當然的。過去 OpenAI 還常常靠着在我們發佈之前,從他們的想法儲備中搶先宣佈消息來搶佔 AI 輿論周期。但現在可以説,那些儲備已經見底了。
現在,我已經加入了 xAI。原因衆所周知:算力、數據以及大約一百位聰明且勤奮的人,就足以訓練出前沿級的大語言模型。xAI 對此深信不疑。
算力方面,即便在谷歌,我也從未見過人均擁有如此數量的芯片。隨着 Colossus 2 的上線,xAI 還將迎來超過 10 萬塊 GB200 與 30 萬塊芯片的投入使用。數據方面,Grok 4 在強化學習和后訓練的規模化上做出了最大押注。xAI 還在數據擴展、深度思考與訓練範式方面進行新的嘗試。
整個團隊行動極其迅速,沒有任何一家公司能夠在如此短的時間內達到 xAI 今天在 AI 能力上的水平。正如馬斯克所説,「一家公司創新速度的一階與二階導數最為重要:xAI 的加速度是最高的。」
我很高興地宣佈,在加入 xAI 的前幾周,我們就發佈了 Grok 4 Fast。Grok 4 是一款出色的推理模型,依然在 ARC-AGI 和 FinSearchComp 等新基準上保持領先。不過,它運行較慢,而且從未真正面向通用用户需求。Grok 4 Fast 則是最優秀的小型模型之一,在 LMArena 上排名第 8(而 Gemini 2.5 Flash 僅排第 18)。在 AIME 等核心推理評測中,它的表現與 Grok 4 相當,但成本卻降低了 15 倍。
根據 Dustin Tran 的領英資料,他本科畢業於加州大學伯克利分校,此后原本在哈佛大學讀統計學博士,但之后轉到了哥倫比亞大學讀計算機科學博士。
他在 2017 年加入谷歌,直到最近離職加入 xAI。