熱門資訊> 正文
2025-10-08 12:22
衡宇 發自 麥蒿寺
量子位 | 公眾號 QbitAI
另一位「堯舜禹」也轉會了!
剛剛,谷歌DeepMind迎來一位新研究科學家,他叫姚順宇——
清華大學物理系校友、清華本科特等獎學金獲得者、本科時期就登上《Physical Review Letters》的超級學霸。
他的個人主頁上明確寫道,姚順宇已於9月19日離開Anthropic,並且在10天后正式加入谷歌DeepMind,擔任高級研究科學家,繼續從事AI方面的研究。
在Anthropic工作的1年時間里,他參與組建了公司的強化學習基礎團隊,負責了Claude 3.7 Sonnet框架,以及Claude 4系列背后的基本強化學習理論。
在個人主頁的隨筆里,姚順宇用了一句頗為瀟灑的話作為告別:
So Ant, it was good with you, but it is better without you :)
在Anthropic工作很愉快,但沒有你俺會更好
姚順宇正式入行AI,其實才不到一年。
去年10月,他從伯克利博士后崗位離開,加入了Anthropic,成為Claude團隊的一員。
當時Claude 3.7 Sonnet的研究工作剛剛啟動,而他也參與了自此后的關鍵強化學習模塊搭建。
在隨筆中,他不經意透露出Anthropic的工作強度——用「超級忙」來形容,一點也不誇張。
姚順宇表示,其實從加入Anthropic后,他就一直想寫一篇短文講講自己離開物理學轉向 AI 研究的心路歷程,但因為「Anthropic的工作強度」,他從未有時間將這些寫下來。
直到離開Anthropic,入職谷歌DeepMind的這段gap時間,他才抽出空來動筆。
除了忙忙忙忙忙以外,從一個理論物理研究者,突然變成AI大模型團隊的科學家,這中間還有哪些體悟?
姚順宇在親筆文章《My infant year as an AI researcher》中講得非常坦誠。
首先,他離開求學階段主攻的物理領域並不是對物理沒興趣。
正因為他曾經如此熱愛這個領域,才更清楚它當前所面臨的瓶頸:
理論物理學是一個極佳的訓練領域:它充滿智力挑戰,深邃且需要廣泛領域的技巧,包括數學、計算機科學(例如複雜性理論)當然還有物理學本身。然而,這個領域已經多年沒有新的實驗了。一個缺乏實驗的領域會以多種方式帶來問題,例如,很難客觀地判斷一項理論工作的重要性。也很難僅僅通過系統性的實驗來解開分歧/困惑。
所以,他還是想找到一個更有利於年輕人的發展方向。
選來選去,就剩下了AI和量子計算。
但量子計算還有實驗平臺這個瓶頸大山擺在面前,所以姚順宇果斷選擇了AI,這個「有趣的類似物理學的研究」。
今天的大模型研究仍處於那個「連神經網絡為何有效都説不清楚」的混沌時代,但這並不妨礙它以驚人的速度演化。
這種狀態像極了17世紀的熱力學研究——
當時的人類連「熱是什麼」都搞不清楚,還在相信燃素説;但依然通過系統實驗找到了如波義耳定律那樣的關係式,從而一步步發展出熱機,最終改變世界。
姚順宇表示,作為一個物理出身的AI研究者,AI研究目前「不懂原理但能持續找到規律」的感覺,他非常熟悉,也很享受。
在Anthropic打工的一年里,姚順宇看到自己的研究立刻能對前沿模型的能力產生影響,並見證人們與AI的交互方式隨新功能出現而發生變化,他感到非常興奮。
這也是與物理學研究反饋非常不同的一點。
但滿足感並不足以讓姚順宇繼續在Anthropic待下去。
他透露出自己離開的兩方面原因:
第一個,是「價值觀的根本分歧」,這個原因佔到了40%。
在文章中,他寫得非常剋制,但態度明確,「Anthropic的一些態度對中國科研者乃至中立立場的員工來説都極不友好。」
他也強調,Anthropic的很多同事並不認同這樣的立場。
但對於他個人來説,實在無法接受繼續以員工身份留在Anthropic。
剩下的60%則涉及Anthropic內部的一些細節,他選擇不對外公開。
可以感受到,他的決定並非一時衝動,而是深思熟慮后的轉身。
對姚順宇來説,這份為期1年的旅程,該結束了。
回顧這一年,姚順宇感慨萬千:與物理學相比,AI的發展速度簡直瘋狂,Claude模型版本已經從3.7迭代到了4.5……
大家都愛開玩笑説AI一天,人間一年。他驚訝於發生了這麼多事,也為此感到非常榮幸。
「但現在,是時候向前看了。」
清華特獎得主、物理學霸姚順宇
回頭看姚順宇的成長路徑,幾乎是科研人生理想型。
他本科就讀於清華大學物理系,曾拿下過清華本科生特等獎學金(清華授予在校優秀本科生的最高獎學金榮譽)。
但真正讓他在本科期間名聲大噪的,是他在凝聚態物理領域做出了突破性貢獻。
2018年,姚順宇在《Physical Review Letters》(國際物理學領域最頂級的學術期刊之一)發表高水平論文,首次在國際上給出了關於非厄米系統的拓撲能帶理論,不僅準確預測了相關現象,他還定義了兩個新的物理概念。
在物理界,這屬於重量級成果。
其研究的含金量之高,可以通過某211大學副教授的評價來感受一下:
我們這邊即使是教授,也沒有能超過姚順宇同學目前本科期間的物理水平的。
本科畢業后,他赴斯坦福大學繼續攻讀博士,專注於量子多體混沌、開放量子系統動力學等前沿問題,師從Douglas Stanford(美國理論物理學家,被同行視為頂尖且有潛力改變物理學發展方向的年輕科學家之一)、Zhenbin Yang(楊振斌,華裔美國科學家,公認的20世紀最重要的物理學家之一)等知名學者。
2023年,在斯坦福求學的姚順宇和團隊提出了「Scramblon Mode」機制,它描述大N混沌量子系統中介導蝴蝶效應的Scramblon模式,自相互作用和多環路效應研究。
去年博士畢業后,他先是去UC伯克利做了會博士后研究,但沒幾個月就被Anthropic喜提走了。
儘管已經離開,姚順宇仍然表示:「Anthropic依舊是物理背景PhD轉行AI研究的最佳去處之一。」
主要原因是Anthropic招人時對物理背景的人才有所偏好。
其創始人曾經公開表示過,有這種偏好的「部分原因是物理學家學東西非常快」。
在Anthropic工作的一年里,姚順宇完成了從研究到業界、從物理學家到AI研究員的角色切換。
不過,根據姚順宇的博文可以得知,Anthropic的核心研究員現在已經不再撰寫論文了,他並不想讓自己的經驗和知識在某個特定的公司/機構/實驗室定型。
如今轉戰谷歌DeepMind,姚順宇將把跨界經驗帶入下一階段:
在DeepMind,繼續從事AI方面的研究。
目前,姚順宇已經在領英、𝕏、谷歌學術等多個平臺都更新了自己的轉會信息。
One More Thing
寫到最后,不得不提一嘴另一位清華「堯舜禹」。
那位名字正確寫法是「姚順雨」,學計算機出身,姚班背景,本科時曾任清華聯席會主席,還是圈內知名「AI rapper」。
他主導或參與的研究包括Tree of Thoughts、SWE-bench、SWE-agent、ReAct等,個人還有一篇超出圈的博文《The Second Half》,宣告了AI進入下半場。
今年8月底、9月初,這位同樣令人矚目的少年英才離開待了1年的OpenAI,開啟了個人的AI下半場。
當初,兩位Shunyu Yao是清華同屆同學。
后來在求學完畢后,二位先后入場大模型。
現在,兩人又先后跳槽開啟工作新旅程,繼續親身入局,嘗試改變AI世界的邊界。
所以如果哪天你聽到有人問:「這個方向,Shunyu Yao做過!」
別急着問是哪個。説不定……人家兩人合著呢?(doge)
參考鏈接:
[1]https://alfredyao.github.io/posts/2025-10-06.html
[2]file:///Users/hengknows/Downloads/Shunyu_Yao_CV.pdf
[3]https://mp.weixin.qq.com/s/e8Bj60-SVdZCphtuuJaKRg
[4]https://mp.weixin.qq.com/s/OFBL2yAeQEcylHKm-9M7Ng
(聲明:本文僅代表作者觀點,不代表新浪網立場。)