繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

入職僅一年,套現5000多萬后背刺馬斯克搬走 Grok 核心代碼庫,業內專家:擁有菜譜不等於能做出同樣的菜

2025-09-01 17:54

1

馬斯克起訴前員工偷走 xAI 整個代碼庫

馬斯克又因為打官司上了熱搜,這次他起訴的不是公司,而是前員工。

上周末,xAI 起訴自己的一名前員工,指控其竊取商業機密,並稱此舉可能使競爭對手受益

這家人工智能初創公司在向加州聯邦法院提交的一份新文件中聲稱,前僱員 Xuechen Li「故意惡意複製 xAI 機密信息」和「商業機密」,從 xAI 發放的筆記本電腦複製到他個人控制的一個或多個非 xAI 物理或在線存儲系統中。」xAI 開發了 X 的內部聊天機器人 Grok,該機器人與 OpenAI 的 ChatGPT 等工具競爭。

訴訟稱,這些被盜用的數據「可能被 xAI 的競爭對手(例如 OpenAI)和 / 或外國實體利用,搶佔 xAI 的產品供應和市場擴張,並瞭解和使用其現有和正在開發的產品功能來增強他們自己的 AI 模型。」 訴訟聲稱,獲取此類數據將在 AI 競賽中帶來「潛在的不可逾越的競爭優勢」。

這場訴訟在圈內引發了軒然大波,有業內專家向 InfoQ 表示,大模型的核心競爭力並不完全依賴於代碼本身。模型的表現更多取決於訓練數據、算力投入、工程優化和迭代速度。即便對手拿到了代碼,也難以複製整個訓練流程和底層基礎設施。就像擁有菜譜不等於能做出同樣的菜,關鍵還在於食材、火候和廚師的經驗。

在訴訟中,xAI 稱開發大模型所耗費的成本是巨大的,需要極爲龐大的資金和技術投入。Grok 4 是他們花了數十億美元投資的成果。

「必須涵蓋數據獲取與處理、計算基礎設施以及頂尖人才。鉅額資本投入是必需的,以便篩選高質量數據集、運行成千上萬塊高性能 GPU,並聘用一流的人工智能研究人員。

xAI 於 2023 年 11 月進入市場,僅僅兩年時間,通過在人力和技術上的大量投入,已經成長為一家領先的生成式人工智能公司。xAI 的願景是通過其先進的人工智能(包括其生成式人工智能模型 Grok),推動人類理解力和能力的提升。Grok 是一款頂尖的前沿模型,代表着人工智能研究與開發的最前沿,不斷突破人工智能在多個領域的能力邊界。與 OpenAI 的 ChatGPT、谷歌的 Gemini 以及中國的 DeepSeek 同台競爭,xAI 最新發布的 Grok 4 是全球最先進、最強大的生成式人工智能系統之一,在推理和預訓練能力等行業基準測試中處於領先地位。

Grok 4 是多年研究開發與數十億美元投資的成果。這一進展離不開高技能工程師、科學家和其他專業人士的緊密合作,他們共同推動了人工智能技術的最前沿發展。」

如此大的成果如今對外宣稱被盜走,可想而之馬斯克該有多憤怒。因此該訴訟要求金錢賠償,並旨在阻止 Xuechen Li 繼續在 OpenAI 工作。

那麼,這個 Xuechen Li 什麼來頭?

Xuechen Li 於 2024 年在斯坦福大學獲得計算機科學博士學位,併成為 xAI 的首批 20 名員工之一,擁有加拿大國籍。他一直致力於開發和訓練 xAI 的先進人工智能模型 Grok。

7 月份,Xuechen Li 在他的個人 X 上向他的 14000 多名 X 粉絲發文稱:「一小羣才華橫溢的人,通過高度專注和努力,在很短的時間內能夠取得如此大的成就,這總是讓我感到驚訝。」

作為薪酬方案的一部分,xAI 還向被告授予了期權和股份。

爲了給包括 Xuechen Li 在內的員工股東提供流動性,xAI 於 2025 年 6 月促成購買了 Xuechen Li 部分股份,金額超過 470 萬美元,Xuechen Li 於 2025 年 7 月 23 日收到現金收益。

在尋求更多流動性時,Xuechen Li 於 2025 年 7 月説服 xAI 促成再次購買他更多股份,金額為 220 萬美元。xAI 之所以同意該交易,是因為公司重視他的貢獻,並希望留住他作為一名有成效和成功的員工。Xuechen Li 於 2025 年 7 月 25 日收到了此次出售的現金收益。

Xuechen Li 在離職時獲得了約 700 萬美元的股票期權,他在公司的工程團隊工作,在此崗位上,他能夠接觸並負責 xAI 技術棧的各個組成部分。

2

離職前一天,將機密信息複製到個人電腦

xAI 聲稱,2025 年 7 月 25 日(Xuechen Li 獲得股票出售現金收益的同一天),他將公司的「機密信息」和「商業機密」從工作用筆記本電腦複製到「個人控制的非 xAI 物理或在線存儲系統」。

該公司聲稱,Xuechen Li 採取了廣泛措施來掩蓋其不當行為,包括刪除瀏覽器歷史記錄和系統日誌、重命名文件以及在將文件上傳到個人設備之前對其進行壓縮。

三天后,Xuechen Li 辭職。此前,他已接受 OpenAI 的錄用通知,原定於 8 月 19 日入職

xAI 表示,在 8 月 11 日對其用於檢測和防止數據泄露的安全軟件日誌進行例行審查時,發現了 Xuechen Li 的行為。同一天,xAI 向 Xuechen Li 發送電子郵件,要求他歸還並刪除數據

據報道,Xuechen Li 此時已聘請了一名刑事律師。在 xAI 律師與 Xuechen Li 律師的會面中,Xuechen Li 承認故意竊取 xAI 文件並掩蓋其蹤跡。他允許 xAI 複製他的個人筆記本電腦以供檢查,但該公司表示,他隱瞞了關鍵賬户的密碼,而這些密碼可能會暴露盜竊的全部範圍。

馬斯克現在表示,Xuechen Li 掌握着 xAI 的整個代碼庫。xAI 的代碼庫包含該公司用於構建其眾多模型的所有代碼,以及可能包含 xAI 工程師為使自己在競爭中脫穎而出而想出的許多算法技巧。

馬斯克聲稱 Xuechen Li 有意將所有這些代碼提供給 OpenAI,而 xAI 在訴訟中表示,這些信息本可以用來構建優於 ChatGPT 的模型。AI 模型公司的價值高達數千億美元,其大部分價值在於驅動其模型的代碼和權重。保護這些代碼可能應該是最重要的優先事項之一——由於研究人員經常更換實驗室,有人將他們的代碼帶給競爭對手的風險必然是他們最大的生存風險之一。

爲了避免模型代碼和權重被盜用,作為僱傭條件之一,xAI 要求每一位員工簽署一份《員工保密信息與發明轉讓協議》(以下簡稱「協議」)。

協議對 xAI 員工在保密信息方面設定了明確義務。協議將「保密信息」定義為屬於 xAI 的「任何及所有機密知識、數據或信息」,其中包括但不限於:

商業祕密、專有技術、發明、掩膜作品、創意、流程、公式、源代碼或目標代碼形式的軟件、數據、程序、其他著作作品、專有技能、改進、發現、開發、設計和技術,以及任何其他類型的工作成果及其所有知識產權(如下所定義,合稱「發明」),其中包括所有公司發明;

任何其他可能被公司競爭對手利用、從而對公司造成競爭劣勢的非公開信息。

協議的部分主要內容包括:

要求員工承認僱傭關係「在涉及 xAI 保密信息時建立了一種信任關係」,且公司「對此享有可保護的權益」;

要求員工在「任職期間及離職后」保持保密,不得披露、使用或發表保密信息,除非是履行工作職責所需或經 xAI 高管明確授權。;

要求員工在終止僱傭時歸還「所有」包含或披露保密信息的材料,包括文件、筆記和設備及所有副本,以及「任何其他包含或披露保密信息的材料」;

要求員工向 xAI 提供一份可在計算機上使用的副本,涵蓋存儲在個人設備或系統中的保密信息,並「永久刪除和清除」相關係統中的這些信息;

要求員工「同意在合理要求下向 [xAI] 提供對 [其] 系統的訪問權限,以驗證所需的複製和 / 或刪除已完成」;

要求員工「同意:(a)向 [xAI] 提供訪問任何 [xAI] 財產或需歸還信息的所有所需資料……包括但不限於登錄信息、密碼和賬户信息」。

3

外界怎麼看?

雖然馬斯克過去經常提起訴訟,但這一次依然在網上引起了廣泛討論,尤其是在 Reddit 上掀起了大量陰謀論的猜測。

有 Reddit 用户認為,Xuechen Li 加入 OpenAI 的職位並非真正的工作機會,而是爲了執行「間諜活動」。在他們看來,既然他已經將 xAI 的核心資料帶走,OpenAI 就不需要給他重要崗位,反而可能安排一些無關緊要的工作。

「他不會被聘用到任何真正的職位。他們提供這份工作是作為間諜活動的一部分。既然他們已經得到了他們想要的東西,他就只能在 OpenAI 做相當於清潔廁所的編程工作了。」

另一些用户則猜測,OpenAI 早就暗中支付了報酬給 Xuechen Li,這場訴訟和所謂的「跳槽」不過是早已計劃好的陰謀。

在輿論熱議中,InfoQ 就事件背后的影響與防範問題,採訪了杭州悦數 CTO 葉小萌

4

「核心代碼泄露」是否致命?

對於 xAI 起訴前員工竊取 Grok 代碼一事, 葉小萌認為:

「源代碼泄露雖然嚴重,但不太可能對 xAI 造成不可逆的競爭影響。這類問題在 AI、數據庫、基礎軟件等技術領域並不罕見。代碼泄露最直接的后果是讓競爭對手獲得了對其系統架構和實現細節的深入瞭解,從而縮短追趕的時間。

不過,大模型的核心競爭力並不完全依賴於代碼本身。模型的表現更多取決於訓練數據、算力投入、工程優化和迭代速度。即便對手拿到了代碼,也難以複製整個訓練流程和底層基礎設施。就像擁有菜譜不等於能做出同樣的菜,關鍵還在於食材、火候和廚師的經驗。

「從競爭角度看,代碼泄露最大的影響是加速了對手的跟進節奏。原本 xAI 可能領先半年甚至更久,但泄露后對手可以快速借鑑關鍵技術點,縮小差距。這反過來會迫使 xAI 必須加快產品迭代,持續推出更強的版本來維持領先,也就是要‘move faster’。」

至於后續修復競爭力的成本,葉小萌稱這主要體現在幾個方面:一是加強內部安全管控,比如代碼訪問權限、審計機制和員工離職流程;二是加大研發投入,提升模型更新頻率和技術壁壘;三是通過法律手段遏制信息濫用,同時強化自身知識產權保護。

不少業內人士認為,若訴狀內容屬實,Xuechen Li 幾乎掌握了整個 Grok 4 的核心代碼庫,這或許意味着 xAI 最重要的技術護城河被拱手送出。

但葉小萌持不同觀點。他認為這件事不會從根本上動搖 xAI 的技術路線或市場地位。只要能保持快速創新,xAI 依然有機會在競爭中佔據主動。

事實上,還有個問題值得注意,訴狀顯示,Xuechen Li 通過「技術偽裝」繞過了常規防護措施。這也讓外界疑問:市面上被企業普遍採用的數據防泄漏(DLP)系統,為何沒能及時識別並阻止?針對這一問題,葉小萌表示:

「從技術角度看,這次事件中前員工通過刪除瀏覽器歷史、壓縮重命名文件、隱瞞賬户密碼等方式試圖掩蓋行為,説明這是一次有預謀的竊取。而現有 DLP 系統之所以未能有效阻止,主要原因在於設計理念和實際執行之間存在脱節。

目前企業常用的 DLP 方案在國內外存在明顯差異。很多國外科技公司,尤其是 AI 和大型軟件企業,更傾向於「事后監控」而非「事前防控」。也就是説,他們不會過度限制員工對代碼或數據的訪問權限,而是儘可能保留開發者的自由度,以保障研發效率和創新能力。但與此同時,會完整記錄所有操作日誌——比如誰在什麼時候訪問了哪些文件、執行了哪些查詢、下載或複製行為。

像 Facebook 早年就允許工程師訪問大量核心數據,但每一步操作都會被審計追蹤。這種模式的核心邏輯是:信任人才,但保留追責能力。一旦發現問題行為,可以通過日誌回溯快速定位。

從 xAI 這次能發現員工刪除歷史、隱藏密碼等動作來看,説明他們的監控系統其實做得比較完善——即便對方試圖擦除痕跡,依然能還原部分行為路徑。這恰恰體現了這類「重監控、輕阻斷」策略的有效性。

但這也暴露出當前 DLP 技術的一個明顯短板:它很難防禦內部人員的蓄意規避行為。特別是當員工具備技術能力,且提前規劃行動時,常規的告警規則(如大文件下載、異常外傳)很容易被繞過。比如把代碼打包成隱蔽文件名、通過分段傳輸等方式,就可能逃過自動檢測。

此外,過於嚴格的防控措施又會影響研發效率。如果每個代碼訪問都要審批、每次數據導出都受限,反而會拖慢迭代節奏。這也是為什麼很多 AI 公司寧願選擇「先放權、后審計」的方式。

因此,單純依賴技術手段並不足夠。理想的數據防護應該結合三方面:一是健全的操作審計系統,確保行為可追溯;二是權限的動態管理,根據崗位和項目需求最小化授權;三是配合法律約束和員工合規培訓,形成技術和管理的雙重防線。」

從事件過程來看,Xuechen Li 既是核心研發人員,又在離職前完成高額股票套現。這一細節引發外界對「核心員工利益綁定機制」的反思。葉小萌認為,這類問題本質上是信任與風險的權衡。對於核心研發崗位,尤其是 AI 這種高度依賴創新能力的領域,企業必須給予足夠的數據和代碼訪問權限,過度限制反而會阻礙研發效率。因此,像 xAI 這樣的公司通常不會在事前嚴格設限,而是通過持續的行為監控和離職審計來管控風險。

「關鍵在於:你可以接觸,但所有操作都會被記錄。比如對代碼下載、數據導出等敏感行為進行日誌追蹤,並通過系統自動識別異常模式——如短時間內大量拷貝、非工作時間訪問核心資產等。從本案來看,Xuechen Li 在離職前大量複製代碼到個人設備,正是通過這類審計機制被發現的。這説明,相比‘堵’,更有效的做法是‘看’——放權給人才,同時保留追溯和追責能力。

要避免‘人走機密失’,企業應在三方面發力:一是建立完善的操作審計系統,確保行為可查;二是強化離職流程審查,對關鍵崗位做專項審計;三是通過法律協議(如競業限制、保密條款)形成約束。

説到底,核心員工是 AI 企業的寶貴資產,不能因防風險而犧牲創新效率。真正的安全,不在於把權限鎖死,而在於讓每一次訪問都處在可監控、可追溯的範圍內。」

事實上,AI 行業正處於人才高度流動的階段。研究人員頻繁更換實驗室或公司,「代碼隨人走」的風險越來越被視為企業最大隱患。那麼,該如何從根源上降低機密泄露風險?

葉小萌表示,從現實角度看,尤其是在初創或高速發展的 AI 公司中,過度設置權限壁壘反而會影響協作效率和創新節奏。這類企業更需要的是在開放與安全之間找到平衡。

「我認為目前最可行的路徑,仍然是以操作行為監控為主、法律約束為輔的模式。至於是否可以通過行業協作建立‘核心技術共享邊界’或‘人才流動誠信檔案’,聽起來是個理想方向,但短期內落地難度較大。不同企業間的技術資產、保密標準和商業利益差異太大,很難達成統一規則。類似‘誠信檔案’也涉及隱私、合規和執行公信力等問題,缺乏權威機制支撐,容易流於形式。」

採訪嘉賓簡介:

葉小萌,杭州悦數科技有限公司首席技術官(CTO),圖技術領域資深專家,擁有超過 20 年的數據庫產品設計、研發與管理經驗。他主導打造了全球首個原生支持 ISO GQL 標準的分佈式圖數據庫——悦數圖數據庫,廣泛應用於金融風控、反欺詐等複雜關聯分析場景。

他曾任螞蟻集團 GeaBase 圖數據庫負責人,以及 Facebook(現 Meta)資深軟件工程師,深度參與大規模數據系統與基礎設施的建設。葉小萌長期致力於圖技術的創新與產業化落地,持續推動圖數據庫在企業級應用中的深度實踐與廣泛發展。

參考鏈接:

https://officechai.com/ai/xuechen-li-accepted-openai-offer-and-uploaded-entire-xai-codebase-elon-musk/

本文來自微信公眾號「InfoQ」(ID:infoqchina),作者:冬梅,36氪經授權發佈。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。