繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

另一位Yao Shunyu也跳槽了:與Anthropic價值觀有根本分歧

2025-10-08 12:22

衡宇 發自 麥蒿寺

量子位 | 公眾號 QbitAI

另一位「堯舜禹」也轉會了!

剛剛,谷歌DeepMind迎來一位新研究科學家,他叫姚順宇——

清華大學物理系校友、清華本科特等獎學金獲得者、本科時期就登上《Physical Review Letters》的超級學霸。

他的個人主頁上明確寫道,姚順宇已於9月19日離開Anthropic,並且在10天后正式加入谷歌DeepMind,擔任高級研究科學家,繼續從事AI方面的研究。

在Anthropic工作的1年時間里,他參與組建了公司的強化學習基礎團隊,負責了Claude 3.7 Sonnet框架,以及Claude 4系列背后的基本強化學習理論。

在個人主頁的隨筆里,姚順宇用了一句頗為瀟灑的話作為告別:

So Ant, it was good with you, but it is better without you :)

在Anthropic工作很愉快,但沒有你俺會更好

姚順宇正式入行AI,其實才不到一年。

去年10月,他從伯克利博士后崗位離開,加入了Anthropic,成為Claude團隊的一員。

當時Claude 3.7 Sonnet的研究工作剛剛啟動,而他也參與了自此后的關鍵強化學習模塊搭建。

在隨筆中,他不經意透露出Anthropic的工作強度——用「超級忙」來形容,一點也不誇張。

姚順宇表示,其實從加入Anthropic后,他就一直想寫一篇短文講講自己離開物理學轉向 AI 研究的心路歷程,但因為「Anthropic的工作強度」,他從未有時間將這些寫下來。

直到離開Anthropic,入職谷歌DeepMind的這段gap時間,他才抽出空來動筆。

除了忙忙忙忙忙以外,從一個理論物理研究者,突然變成AI大模型團隊的科學家,這中間還有哪些體悟?

姚順宇在親筆文章《My infant year as an AI researcher》中講得非常坦誠。

首先,他離開求學階段主攻的物理領域並不是對物理沒興趣。

正因為他曾經如此熱愛這個領域,才更清楚它當前所面臨的瓶頸:

理論物理學是一個極佳的訓練領域:它充滿智力挑戰,深邃且需要廣泛領域的技巧,包括數學、計算機科學(例如複雜性理論)當然還有物理學本身。然而,這個領域已經多年沒有新的實驗了一個缺乏實驗的領域會以多種方式帶來問題,例如,很難客觀地判斷一項理論工作的重要性。也很難僅僅通過系統性的實驗來解開分歧/困惑。

所以,他還是想找到一個更有利於年輕人的發展方向

選來選去,就剩下了AI和量子計算。

但量子計算還有實驗平臺這個瓶頸大山擺在面前,所以姚順宇果斷選擇了AI,這個「有趣的類似物理學的研究」。

今天的大模型研究仍處於那個「連神經網絡為何有效都説不清楚」的混沌時代,但這並不妨礙它以驚人的速度演化。

這種狀態像極了17世紀的熱力學研究——

當時的人類連「熱是什麼」都搞不清楚,還在相信燃素説;但依然通過系統實驗找到了如波義耳定律那樣的關係式,從而一步步發展出熱機,最終改變世界。

姚順宇表示,作為一個物理出身的AI研究者,AI研究目前「不懂原理但能持續找到規律」的感覺,他非常熟悉,也很享受。

在Anthropic打工的一年里,姚順宇看到自己的研究立刻能對前沿模型的能力產生影響,並見證人們與AI的交互方式隨新功能出現而發生變化,他感到非常興奮。

這也是與物理學研究反饋非常不同的一點。

但滿足感並不足以讓姚順宇繼續在Anthropic待下去。

他透露出自己離開的兩方面原因:

第一個,是「價值觀的根本分歧」,這個原因佔到了40%。

在文章中,他寫得非常剋制,但態度明確,「Anthropic的一些態度對中國科研者乃至中立立場的員工來説都極不友好。」

他也強調,Anthropic的很多同事並不認同這樣的立場。

對於他個人來説,實在無法接受繼續以員工身份留在Anthropic。

剩下的60%則涉及Anthropic內部的一些細節,他選擇不對外公開。

可以感受到,他的決定並非一時衝動,而是深思熟慮后的轉身。

對姚順宇來説,這份為期1年的旅程,該結束了。

回顧這一年,姚順宇感慨萬千:與物理學相比,AI的發展速度簡直瘋狂,Claude模型版本已經從3.7迭代到了4.5……

大家都愛開玩笑説AI一天,人間一年。他驚訝於發生了這麼多事,也為此感到非常榮幸。

「但現在,是時候向前看了。」

清華特獎得主、物理學霸姚順宇

回頭看姚順宇的成長路徑,幾乎是科研人生理想型。

他本科就讀於清華大學物理系,曾拿下過清華本科生特等獎學金(清華授予在校優秀本科生的最高獎學金榮譽)

但真正讓他在本科期間名聲大噪的,是他在凝聚態物理領域做出了突破性貢獻

2018年,姚順宇在《Physical Review Letters》(國際物理學領域最頂級的學術期刊之一)發表高水平論文,首次在國際上給出了關於非厄米系統的拓撲能帶理論,不僅準確預測了相關現象,他還定義了兩個新的物理概念。

在物理界,這屬於重量級成果。

其研究的含金量之高,可以通過某211大學副教授的評價來感受一下:

我們這邊即使是教授,也沒有能超過姚順宇同學目前本科期間的物理水平的。

本科畢業后,他赴斯坦福大學繼續攻讀博士,專注於量子多體混沌、開放量子系統動力學等前沿問題,師從Douglas Stanford(美國理論物理學家,被同行視為頂尖且有潛力改變物理學發展方向的年輕科學家之一)、Zhenbin Yang(楊振斌,華裔美國科學家,公認的20世紀最重要的物理學家之一)等知名學者。

2023年,在斯坦福求學的姚順宇和團隊提出了「Scramblon Mode」機制,它描述大N混沌量子系統中介導蝴蝶效應的Scramblon模式,自相互作用和多環路效應研究。

去年博士畢業后,他先是去UC伯克利做了會博士后研究,但沒幾個月就被Anthropic喜提走了

儘管已經離開,姚順宇仍然表示:「Anthropic依舊是物理背景PhD轉行AI研究的最佳去處之一。」

主要原因是Anthropic招人時對物理背景的人才有所偏好。

其創始人曾經公開表示過,有這種偏好的「部分原因是物理學家學東西非常快」。

在Anthropic工作的一年里,姚順宇完成了從研究到業界、從物理學家到AI研究員的角色切換。

不過,根據姚順宇的博文可以得知,Anthropic的核心研究員現在已經不再撰寫論文了,他並不想讓自己的經驗和知識在某個特定的公司/機構/實驗室定型。

如今轉戰谷歌DeepMind,姚順宇將把跨界經驗帶入下一階段:

在DeepMind,繼續從事AI方面的研究。

目前,姚順宇已經在領英、𝕏、谷歌學術等多個平臺都更新了自己的轉會信息。

One More Thing

寫到最后,不得不提一嘴另一位清華「堯舜禹」。

那位名字正確寫法是「姚順雨」,學計算機出身,姚班背景,本科時曾任清華聯席會主席,還是圈內知名「AI rapper」。

他主導或參與的研究包括Tree of Thoughts、SWE-bench、SWE-agent、ReAct等,個人還有一篇超出圈的博文《The Second Half》,宣告了AI進入下半場。

今年8月底、9月初,這位同樣令人矚目的少年英才離開待了1年的OpenAI,開啟了個人的AI下半場。

當初,兩位Shunyu Yao是清華同屆同學。

后來在求學完畢后,二位先后入場大模型。

現在,兩人又先后跳槽開啟工作新旅程,繼續親身入局,嘗試改變AI世界的邊界。

所以如果哪天你聽到有人問:「這個方向,Shunyu Yao做過!」

別急着問是哪個。説不定……人家兩人合著呢?(doge)

參考鏈接:

[1]https://alfredyao.github.io/posts/2025-10-06.html

[2]file:///Users/hengknows/Downloads/Shunyu_Yao_CV.pdf

[3]https://mp.weixin.qq.com/s/e8Bj60-SVdZCphtuuJaKRg

[4]https://mp.weixin.qq.com/s/OFBL2yAeQEcylHKm-9M7Ng

(聲明:本文僅代表作者觀點,不代表新浪網立場。)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。