OpenAI停止合作，Meta收購Scale AI攪亂AI圈

2025-06-27 08:19

早在11年前，扎克伯格以190億美元的價格收購WhatsApp，從而確保了后續Meta社交帝國的固若金湯。然而在11年后，當Meta的AI業務有了掉隊的徵兆時，扎克伯格故技重施，豪擲148億美元買下了人工智能數據標註公司Scale AI的49%股份，試圖在這一輪AI競賽中實現后發先至。

然而就在Meta與Scale AI的交易落地后，事情的發展開始超出他們的預料。OpenAI公司發言人在當地時間6月18日向彭博社方面證實，在Meta與Scale AI達成交易后，OpenAI將逐步停止與Scale AI的合作，並切斷與這家數據供應商的聯繫。

無獨有偶，路透社在6月16日的相關報道就曾顯示，谷歌正計劃結束與Scale AI的合作關係。作為Scale AI最大的客户之一，谷歌原定於今年向其支付2億美元來獲得AI訓練數據，但目前他們擬終止合作、選擇向Scale AI的競爭對手尋求合作。對此，數據標註公司Labelbox聯合創始人馬努·夏爾馬公開表示，該公司將從Scale AI流失的客户處「創造數億美元的新收入」。

作為一家以數據標註為核心業務的AI基礎設施公司，被Meta納入麾下的Scale AI註定會與OpenAI、谷歌分道揚鑣。正如AI編程初創企業Windsurf在被OpenAI以30億美元價格收購后，隨即就遭遇了Anthropic削減其Claude 3.x模型的調用配額，而Anthropic給出的迴應「優化長期合作伙伴的模型容量分配」，也被外界一致認為是託詞，真正的原因是其不願意看到Windsurf為OpenAI所用。

相比AI編程工具，作為目前AI大模型三駕馬車之一的數據，顯然還要敏感得多。畢竟Scale AI提供的數據標註、清洗工作相當於是大模型訓練的基礎，而Scale AI改姓Meta，OpenAI、谷歌等公司自然就會擔憂給予Scale AI的訂單，會泄露自己未來AI戰略的方向，所以他們如今的反應也就很好理解了。

不得不説，Meta收購Scale AI可謂是一石二鳥。當下AI行業的一大特點就是「有多少人工、就有多少智能」，由於數據是AI大模型的基礎，它的原理可以總結為在海量數據的基礎上進行預訓練，再輔以監督微調帶來的性能改進，而AI大模型之所以比以往的AI產品表現得更聰明，就是因為數據規模更大。

當下AI行業最大的問題，就在於Common Crawl、The Pile等開源且質量有保障的數據集已經被使用完畢。除了公開優質數據被挖掘殆盡之外，即使是算法仿真出來的合成數據，同樣也需要有足夠的自然數據來作為基礎，並且AI大模型過於依賴合成數據還可能會直接「崩潰」。

這時候像Scale AI這類提供數據清洗、數據標註服務的公司，就成爲了新的數據來源。在Meta收購Scale AI后，相當於有了一個穩定的高質量數據供給，進而可以幫助Llama模型繼續進化。可是在友商的視角下，Scale AI成為Meta的「家人」帶來的后果可就太恐怖了。

當Scale AI失去中立者的角色，自然就無法與他們的客户形成互信。再加上預訓練數據泄露、導致自家AI業務發展方向被提前曝光，其實還只是小問題，OpenAI與谷歌真正害怕的是數據投毒攻擊（Data Poisoning Attack），即向AI大模型投放被污染的有害數據，進而導致模型性能下降。

不同於通過發現漏洞、再編寫代碼的傳統網絡攻擊，針對AI大模型的數據投毒攻擊其實更難防備。目前數據投毒攻擊的目標，主要是用於訓練機器學習的數學能力，並非是在訓練模型的參數中找到問題的關聯性，而是要通過修改訓練數據，就將這些關聯性植入到模型中。

根據AI安全研究人員的説法，只需要「毒害」不到0.7%數據就可以完全繞過AI廠商的防禦，導致輸出內容的準確率大幅下降。

那麼問題就來了，過去幾年的時間里，為何極少出現數據投毒攻擊的成功案例呢？這是因為攻擊者必須能夠訪問AI大模型的訓練管線，然后纔可以分發中毒模型。

例如被起訴要賠償800萬元的字節跳動前實習生，他之所以能成功對字節跳動的AI模型投毒，源於其AI Lab的實習生權限與正式員工差異不大。‌畢竟「堡壘總是從內部被攻破」的，作為數據供應商的Scale AI一旦從源頭就提供有毒的數據，OpenAI和谷歌的AI大模型訓練節奏就勢必會受到影響。

如果與字節跳動的前實習生一樣，Scale AI一旦無規律地污染數據，就必然會導致OpenAI、谷歌的大模型訓練效果忽高忽低、非常不穩定，並且始終無法產生預期的訓練結果。更為致命的是這種攻擊其實相當難分辨，即便是此前字節跳動排查不專業的前實習生，也花了差不多兩個月才查明真相。

可是對於如今時間就是金錢的AI賽道來説，AI大模型訓練進程被拖延顯然是OpenAI和谷歌無法接受的事情。看到這里，可能有的朋友會問，Scale AI被Meta收購后真的會做出危害OpenAI、谷歌等合作伙伴的事情嗎？只能説千萬不要高估這一批看起來高大上的互聯網巨頭的節操，特別是還有劍橋分析醜聞前科的Meta。

因此爲了防患於未然，OpenAI和谷歌當然也不願意去賭一賭Scale AI被Meta收購后，還是否依然能保持中立。

本文來自微信公眾號「三易生活」（ID：IT-3eLife），作者：三易菌，36氪經授權發佈。

OpenAI停止合作，Meta收購Scale AI攪亂AI圈

推薦文章

一周財經日曆 | 特朗普對等關税將於8月7日生效；Palantir、超微電腦等財報來襲

8月金股搶先睇！港股能否繼續抽升？哪些賽道值得關注

英諾賽科午前飆升逾31% 英偉達最新800V架構供應商名單曝光公司為中國唯一入選芯片企業

亞馬遜Q2業績會實錄：市場對AWS服務需求超過亞馬遜現有容量

特朗普官宣「對等關税」：各國税率10%至41%不等 加拿大上調至35%

盤后大跌6%！亞馬遜交出優秀財報 但云業務仍遜色於微軟谷歌

蘋果第三財季營收940.36億美元 淨利潤同比增長9%

外盤頭條：白宮稱特朗普將在午夜前設定新關税 蘋果季度營收遠超預期 Pimco青睞短至中期歐洲債券

特朗普官宣「對等關税」：各國税率10%至41%不等加拿大上調至35%

盤后大跌6%！亞馬遜交出優秀財報但云業務仍遜色於微軟谷歌

蘋果第三財季營收940.36億美元淨利潤同比增長9%

外盤頭條：白宮稱特朗普將在午夜前設定新關税蘋果季度營收遠超預期 Pimco青睞短至中期歐洲債券