熱門資訊> 正文
2025-07-26 22:39
最近,Meta成立了「超級智能」AI實驗室,四處砸錢挖人。
這收入水平可能性非常大。據報道,爲了從OpenAI挖走他們的首席研究官Mark Chen,扎克伯格提供了高達10億美元的薪酬提議。
值得關注的是,除了Yann LeCun等部分Meta的「AI元老」,名單里大部分都是這個月新入職的員工;而且名單里有一半本科畢業於國內的大學。
而這些「中國大學生」中,清華校友Yuanzhi Li又是比較獨特的一位:之前,他是卡內基梅隆大學的助理教授,沒有業界工作經驗。
普通人只能像網友Meet一般感嘆:平庸與卓越差距如此之大!
不過,即便是清華的畢業生、即便也是美國的教授,也不是人人都有機會參加Meta的這波「AGI選秀」。
剛剛,清華校友、杜克大學教授陳怡然發微博如此表示。
小扎這是用實際行動證明:「知識就是財富」!
和Yann LeCun同榜的前教授
Yuanzhi Li入職Meta已有4個月,任研究科學家;入職Meta之前,他是卡內基梅隆大學(CMU)的助理教授。
他沒有產業界的工作經歷,主要研究深度學習理論。
目前,他的谷歌學術被引次數超過了4萬,特別是2023年后,被引數開始爆發。
他是LLM微調方法低秩自適應LoRA的合著者。
他還參與了微軟語言模型Phi系列的研發,包括Phi-2、Phi-3、Phi-4等模型。
他還是「語言模型物理學」(Physics of Language Models)研究項目的主要參與者。
2014年,他獲得了清華大學計算機科學學士學位;2018年,他獲得了普林斯頓大學計算機科學博士學位。
不過,除了AI頂尖的研究人才,Meta在數據上也下了血本。
據報道,國際上頂級AI集團正在用高薪的行業專家替代非洲和亞洲低成本的「數據標註員」。
特別是,Meta和貝索斯狂砸百億,招聘物理學家、生物學家當「AI的老師」,打造超越人類的「超級大腦」。
數據標註行業,悄悄來了一次產業升級。沒學歷,數據標註都干不了?
推理模型大爆發
AI數據成關鍵
Scale AI、Turing和Toloka等AI數據服務商,正在聘請生物學和金融等領域專家,幫助他們創建更復雜的訓練數據。
隨着OpenAI o3和谷歌Gemini 2.5之類的推理AI模型的崛起,企業加速淘汰肯尼亞、菲律賓等國每小時薪酬不足2美元的低成本標註員。這些工人此前主要從事耗時的人工標註工作,為AI模型訓練提供海量數據集。
荷蘭的AI數據商Toloka的首席執行官兼聯合創始人Olga Megorskaya説:
「AI行業曾長期專注於模型和計算,而數據一直被忽視。終於,(AI行業)開始意識到數據在訓練中的重要性。」
這一轉變導致投資者對數據標註初創公司興趣大增。
例如,在6月,Meta向美國的Scale AI投資了150億美元,使其估值翻倍至290億美元,以追趕競爭對手。
同樣地,位於加州的Turing AI在3月以22億美元的估值籌集了1.11億美元資金。
貝索斯的個人公司Bezos Expeditions則在5月領投了Toloka的7200萬美元融資輪次。
產業升級,專家加薪20%
過去,數據標註員處理的任務比較簡單,比如在圖像上畫框來識別對象、描述圖像內容、選擇流利的表達方式以及從常包含暴力或圖形內容的數據集中剔除不良答案。
由於AI模型需要海量數據提升性能,這些工人需在數秒內處理單個任務,日均完成數百項任務以構建龐大數據庫。
然而,隨着許多任務已自動化,這些需求已經大幅下降。這些過去從事AI最底層的工人,某種意義上被AI取代了。
肯尼亞數據標註員協會(Data Labelers Association)主席Joan Kinyua表示,工人們現在被要求處理依賴本地語言技能和知識的任務。
該協會還發現,部分任務要求標註員對AI生成的內容進行最終質量控制檢查。
隨着OpenAI、Anthropic和谷歌等AI巨頭努力開發ASI,而這些模型或將超越人類智能,行業正在加大對數據集質量的關注,僱傭專家來解決複雜問題。
Turing AI的聯合創始人兼首席執行官Jonathan Siddharth表示:「現在需要的是人類使用模型完成腦力工作的真實數據,以及模型出錯時的反饋。」
爲了確保模型在從編程到物理學、金融等多個領域的表現,資金雄厚的AI公司現在願意支付費用,獲取更復雜的數據集,從而聘請全球的專家。
Siddharth透露,Turing為跨行業專家提供比原職高20%-30%的薪酬。儘管數據預算僅佔AI公司算力支出的10%-15%,但這仍是「一筆鉅款」。
Toloka的Olga Megorskaya表示,諸如「思維鏈」之類的新功能,要讓人類專家演示如何拆解問題,之后纔開發出來的。
經驗豐富的軟件工程師可能還需根據自身領域設計任務,並通過編寫代碼、調試程序及檢查安全漏洞來解決問題。
與此同時,驗證物理學理論需要多方協作:物理學家負責闡述如何構建模擬器來檢驗理論真偽,軟件工程師編寫模擬器代碼,數據科學家則分析模擬結果。
Turing AI的Siddharth指出:「由此產生的模型不僅會超越物理學家,更將超越物理學、計算機科學與數據科學三大領域頂尖人才的疊加能力。」
(聲明:本文僅代表作者觀點,不代表新浪網立場。)