繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

OpenAI停止合作,Meta收購Scale AI攪亂AI圈

2025-06-27 08:19

早在11年前,扎克伯格以190億美元的價格收購WhatsApp,從而確保了后續Meta社交帝國的固若金湯。然而在11年后,當Meta的AI業務有了掉隊的徵兆時,扎克伯格故技重施,豪擲148億美元買下了人工智能數據標註公司Scale AI的49%股份,試圖在這一輪AI競賽中實現后發先至。

然而就在Meta與Scale AI的交易落地后,事情的發展開始超出他們的預料。OpenAI公司發言人在當地時間6月18日向彭博社方面證實,在Meta與Scale AI達成交易后,OpenAI將逐步停止與Scale AI的合作,並切斷與這家數據供應商的聯繫。

無獨有偶,路透社在6月16日的相關報道就曾顯示,谷歌正計劃結束與Scale AI的合作關係。作為Scale AI最大的客户之一,谷歌原定於今年向其支付2億美元來獲得AI訓練數據,但目前他們擬終止合作、選擇向Scale AI的競爭對手尋求合作。對此,數據標註公司Labelbox聯合創始人馬努·夏爾馬公開表示,該公司將從Scale AI流失的客户處「創造數億美元的新收入」。

作為一家以數據標註為核心業務的AI基礎設施公司,被Meta納入麾下的Scale AI註定會與OpenAI、谷歌分道揚鑣。正如AI編程初創企業Windsurf在被OpenAI以30億美元價格收購后,隨即就遭遇了Anthropic削減其Claude 3.x模型的調用配額,而Anthropic給出的迴應「優化長期合作伙伴的模型容量分配」,也被外界一致認為是託詞,真正的原因是其不願意看到Windsurf為OpenAI所用。

相比AI編程工具,作為目前AI大模型三駕馬車之一的數據,顯然還要敏感得多。畢竟Scale AI提供的數據標註、清洗工作相當於是大模型訓練的基礎,而Scale AI改姓Meta,OpenAI、谷歌等公司自然就會擔憂給予Scale AI的訂單,會泄露自己未來AI戰略的方向,所以他們如今的反應也就很好理解了。

不得不説,Meta收購Scale AI可謂是一石二鳥。當下AI行業的一大特點就是「有多少人工、就有多少智能」,由於數據是AI大模型的基礎,它的原理可以總結為在海量數據的基礎上進行預訓練,再輔以監督微調帶來的性能改進,而AI大模型之所以比以往的AI產品表現得更聰明,就是因為數據規模更大。

當下AI行業最大的問題,就在於Common Crawl、The Pile等開源且質量有保障的數據集已經被使用完畢。除了公開優質數據被挖掘殆盡之外,即使是算法仿真出來的合成數據,同樣也需要有足夠的自然數據來作為基礎,並且AI大模型過於依賴合成數據還可能會直接「崩潰」。

這時候像Scale AI這類提供數據清洗、數據標註服務的公司,就成爲了新的數據來源。在Meta收購Scale AI后,相當於有了一個穩定的高質量數據供給,進而可以幫助Llama模型繼續進化。可是在友商的視角下,Scale AI成為Meta的「家人」帶來的后果可就太恐怖了。

當Scale AI失去中立者的角色,自然就無法與他們的客户形成互信。再加上預訓練數據泄露、導致自家AI業務發展方向被提前曝光,其實還只是小問題,OpenAI與谷歌真正害怕的是數據投毒攻擊(Data Poisoning Attack),即向AI大模型投放被污染的有害數據,進而導致模型性能下降。

不同於通過發現漏洞、再編寫代碼的傳統網絡攻擊,針對AI大模型的數據投毒攻擊其實更難防備。目前數據投毒攻擊的目標,主要是用於訓練機器學習的數學能力,並非是在訓練模型的參數中找到問題的關聯性,而是要通過修改訓練數據,就將這些關聯性植入到模型中。

根據AI安全研究人員的説法,只需要「毒害」不到0.7%數據就可以完全繞過AI廠商的防禦,導致輸出內容的準確率大幅下降。

那麼問題就來了,過去幾年的時間里,為何極少出現數據投毒攻擊的成功案例呢?這是因為攻擊者必須能夠訪問AI大模型的訓練管線,然后纔可以分發中毒模型。

例如被起訴要賠償800萬元的字節跳動前實習生,他之所以能成功對字節跳動的AI模型投毒,源於其AI Lab的實習生權限與正式員工差異不大。‌畢竟「堡壘總是從內部被攻破」的,作為數據供應商的Scale AI一旦從源頭就提供有毒的數據,OpenAI和谷歌的AI大模型訓練節奏就勢必會受到影響。

如果與字節跳動的前實習生一樣,Scale AI一旦無規律地污染數據,就必然會導致OpenAI、谷歌的大模型訓練效果忽高忽低、非常不穩定,並且始終無法產生預期的訓練結果。更為致命的是這種攻擊其實相當難分辨,即便是此前字節跳動排查不專業的前實習生,也花了差不多兩個月才查明真相。

可是對於如今時間就是金錢的AI賽道來説,AI大模型訓練進程被拖延顯然是OpenAI和谷歌無法接受的事情。看到這里,可能有的朋友會問,Scale AI被Meta收購后真的會做出危害OpenAI、谷歌等合作伙伴的事情嗎?只能説千萬不要高估這一批看起來高大上的互聯網巨頭的節操,特別是還有劍橋分析醜聞前科的Meta。

因此爲了防患於未然,OpenAI和谷歌當然也不願意去賭一賭Scale AI被Meta收購后,還是否依然能保持中立。

本文來自微信公眾號「三易生活」(ID:IT-3eLife),作者:三易菌,36氪經授權發佈。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。