熱門資訊> 正文
2025-02-09 11:47
【文/觀察者網 楊蓉】
中國人工智能(AI)初創企業DeepSeek的「異軍突起」,不僅給硅谷帶來技術路線的衝擊,震動了華爾街資本市場,也引發了美國對於AI人才流動的反思。
英偉達高級研究科學家禹之鼎日前在社交媒體透露,DeepSeek旗下一名關鍵工程師曾在這家美國AI芯片巨頭實習且有望轉正,但最終選擇回國加入當時仍名不見經傳的DeepSeek。這讓美國知名國際政治學者、前助理國防部長格雷厄姆·艾利森感嘆,美國未能真正吸引、留住人才,應為華盛頓敲響警鍾。
「印象深刻」的決定
這名受到艾利森關注的DeepSeek研究員名為潘梓正。潘梓正在GitHub上公開的簡歷顯示,他本科畢業於哈爾濱工業大學,碩士畢業於澳大利亞阿德萊德大學。2021年至2024年,他在莫納什大學攻讀計算機科學博士,2023年夏季曾在英偉達實習。
潘梓正(右)及他在DeepSeek-VL2多模態模型論文中的署名 GitHub
1月27日,DeepSeek登頂蘋果美區應用商店免費App下載排行榜,潘梓正在社交平臺X(原推特)上發帖慶祝,曾是他在英偉達實習期間導師的禹之鼎隨即轉發,同時披露了潘梓正加入DeepSeek前的故事。
禹之鼎回憶,英偉達當時原本正考慮給潘梓正全職工作機會,但他「毫不猶豫」選擇回國加入DeepSeek,當時這家初創公司的多模態團隊還只有3人。禹之鼎説,潘梓正后來在DeepSeek的多個重要項目中發揮了「關鍵作用」,包括DeepSeek-VL2、DeepSeek-V3和DeepSeek-R1。
「我至今仍然對梓正當時的決定印象深刻……我個人非常為他的決定和取得的巨大成就感到高興。」禹之鼎寫道,「梓正的案例是近年來我所見到的一個非常典型的例子。我們許多最優秀的人才都來自中國,而這些人才並不一定只能在美國公司取得成功。相反,我們也從他們身上學到了很多。」
「不是第一位,也不會是最后一位」
此后不到兩年,DeepSeek就憑藉開源模型-V3和推理模型R1在海內外一舉成名。
V3的正式訓練成本僅為557.6萬美元,約為美國OpenAI GPT-4預算的1/20;R1性能比肩OpenAl o1,但將每百萬token(自然語言處理和機器學習分割語言的基本處理單元,AI模型通過token對文本進行理解和處理)的價格從o1的60美元降至2.19美元,差價近30倍。
「R1證明了,突破性的AI進展不一定依賴於更大的計算集羣和更龐大的數據集。」《麻省理工科技評論》評價道,「這些發現正在顛覆‘更大即更好’的傳統認知,為那些計算資源有限的機構和企業帶來了新的可能。」DeepSeek最新模型發佈后,英偉達市值單日蒸發近6000億美元,美國上市科技企業總市值單日縮水約1萬億美元。
這讓美國知名國際政治學者、哈佛大學肯尼迪政府學院創始院長、美國前助理國防部長格雷厄姆·艾利森(Graham Allison)不禁發問:「是誰錯失了DeepSeek?」
艾利森 英國《新政治家》雜誌網站
艾利森2月1日發文,形容DeepSeek對美國AI公司的顛覆堪比《聖經》中大衞殺死巨人哥利亞。「它也生動地提醒我們,美國必須嚴肅對待吸引和留住人才這件事,尤其是來自中國的人才。」
「為什麼潘梓正——在開發DeepSeek的R1模型中發揮主導作用的工程師——會選擇把自己的才能投入到中國,而不是美國,來創造這一非凡的技術突破?」艾利森説,「答案:因為他為之開發算法的硅谷公司沒有為他提供機會,讓他能在美國繼續做這項工作。」
他就此提到同樣從美國歸國的中國「兩彈一星」元勛錢學森——1950年代,錢學森受到美國麥卡錫主義風潮波及,被控同情共產主義,被「驅逐回國」——並斷言潘梓正「不是美國失去的第一位超級人才,也不會是最后一位」。
艾利森引述美國《華爾街日報》一篇專欄文章強調,中國的工程師總數是美國的9倍,STEM(科學、技術、工程、數學)畢業生數量更是美國的15倍。「在當前世界里,像錢學森、(英偉達CEO)黃仁勛或(特斯拉CEO)馬斯克這樣百萬分之一的超級天才可以用腳投票,把他們的才華用在他們選擇的任何地方。」
回國發展成趨勢
事實上,總部位於美國的科技媒體Rest of World(下稱「RoW」)最近與多名中國科技行業人士對話后發現,放棄硅谷工作、選擇在國內發展已經成為中國頂尖AI人才內部的一種趨勢。
據一名在美國知名科技公司工作的的中國AI研究員向RoW透露,美國公司會聘請工程或數據處理能力強的中國實習生,以遠程或在硅谷辦公室的方式參與AI項目,且這些中國學生的工作往往「非常紮實」。
不過,該研究員表示,這些中國學生即使拿到轉正機會,許多人還是選擇回國。「讓我感到驚訝的是,許多中國學生對在美國從事全職工作並不那麼感興趣。」
關於其背后原因,有業內人士向RoW指出,優秀畢業生在國內就業不僅生活成本更低、離家人更近,還利於個人發展,在職業生涯起步階段就有機會負責關鍵工作。
此外,報道分析,也有部分原因在於美國近來移民政策對於華人並不友好,以及隨着中國國內AI產業的蓬勃發展,相關領域畢業生在國內就業的選擇變得更多,既有阿里巴巴這樣的科技巨頭,也有階躍星辰、Minimax和零一萬物為代表的初創公司。
中國AI人才庫儲備充足
根據美國保爾森基金會旗下的麥克羅波洛智庫(Macro Polo)去年3月發佈的一項研究,從本科院校來看,中國高校幾乎培養了全球一半的頂尖AI研究人員;相比之下,僅有約18%研究人員來自美國大學。
研究還稱,儘管美國在生成式AI領域率先取得了突破性進展,但其中很大一部分工作是由在中國接受教育的研究人員完成的。據悉,美國頂尖AI研究人員中,來自中國的研究人員佔38%,美國人佔37%。
在美國南加州大學研究中國科技法規的法學教授張湖月看來,DeepSeek的成功正「凸顯了中國AI人才庫的實力」。「大量能力強、技術嫻熟的軟件工程師為DeepSeek提供了支持。」張湖月説,「我相信,這種人才優勢為中國下一階段的AI發展奠定了堅實的基礎。」
RoW稱,藉由國內高校、實驗室以及美國科技巨頭在華的研究機構(如總部設在北京的微軟亞洲研究院),中國培養了一大批本土AI研究人員,DeepSeek更是從中優中選優。
報道舉例説,DeepSeek-R1模型的核心貢獻者宋俊瀟,學生時代就已在同齡人中嶄露頭角。宋俊瀟在香港科技大學攻讀電子與計算機工程期間的博士生導師丹尼爾·帕洛馬爾(Daniel Palomar)説,宋學習刻苦,「不知怎的,(DeepSeek)設法找到了精英中的精英」。
本文系觀察者網獨家稿件,未經授權,不得轉載。