繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

OpenAI頭號叛徒,竟然是自學的AI?

2025-08-22 14:44

原標題:OpenAI頭號叛徒,竟然是自學的AI?

成就OpenAI、打倒OpenAI(咳咳)創立對家Anthropic,從此化身前司的心腹大患……

嘿!這還真就是Anthropic聯合創始人Tom Brown自個兒分享的AI奮鬥史

要説傳奇吧,這哥們大學還只是個線性代數只能拿B-的「廢柴」,直到一朝頓悟裸辭自學AI,然后憑一己之力攪動整個大模型格局。

OpenAI、Google Brain、Anthropic三家公司反覆橫跳,現在扛着Claude直接對打老東家。

估計奧特曼半夜起來也得問問自己:一個AI「邪修」,怎麼就讓OpenAI大喊不妙了?

端好小板凳,下面一起來康康他是如何讓前老闆破防的。

離開老東家,超越老東家

Tom Brown説,他的祕訣就是他們不「應試」

其他家的模型都是瞄準了基準測試,每天想的都是怎麼刷題拿高分……(嘶,這話説的,怎麼這麼像那個剛剛拿下IMO、IOI雙料金牌的某O家呢)

而Anthropic則更像是「快樂教育」,主要看重的還是內部基準以及dogfooding,就是讓自家工程師天天用Claude干活,然后獎勵Claude小餅乾(doge)。

就像Claude Code最初也只是一名Claude工程師爲了偷懶,自己做的一款內部工具,結果陰差陽錯推出后大受好評。

Claude在他們團隊里不止是工具,而是將其視作用户一樣的存在,圍繞模型設計,讓其兼顧平臺和用户的思維方式,鼓勵開發者不止充當用户身份,也可以積極探索如何更好地訓練模型為己所用,這就是他們成功的關鍵。

就是這樣Free,造就了好模型Claude 3.5 Sonnet,這也是Tom Brown最引以為傲的成果。

Tom表示,其實當時他們做出的第 一款產品是Slackbot版的Claude,比ChatGPT還早九個月,不過由於缺乏足夠的服務器基礎設施,以及不確定它可能會造成的影響,於是一猶豫,錯失了發佈良機。

后面因為目睹了ChatGPT的成功,他們才匆匆忙忙重新端上了API,隨后又推出了Claude AI,不過一直都不温不火,直到Claude 3.5 Sonnet發佈,才徹底點燃AI編碼的熱情。

Tom Brown透露,他們對Claude 3.5 Sonnet成功的驚訝,不亞於OpenAI對ChatGPT的意外,尤其是在代理式編程和執行復雜任務方面給了他們驚喜。

而恰恰就是Claude 3.5 Sonnet橫空出世,讓Anthropic有了和OpenAI掰手腕的底氣。

憶往昔23年的時候,OpenAI還如日中天,50%的市場都被它一家攥着,結果好嘛,現在直接墜機、下降25%。

反觀Anthropic,兩年前還只能跟在OpenAI身后撿剩下的,現在市場里32%都是它家的天下,尤其是編程這塊,Anthropic才真老大,超老東家兩倍還多。

誰也沒想到,這家由Tom Brown和一羣前OpenAI員工「叛逃」創立的公司,做的第 一件大事就是想將老東家斬於馬下。

這里就不得不提,曾獲OpenAI青睞有加的Cursor,奧特曼的投資一拿就立馬反水Anthropic,旗下編程默認模型直接從GPT改換成Claude。

OpenAI想收購Windsurf,Anthropic就立馬切斷Windsurf的Claude API訪問權限,想站隊OpenAI?那就和Claude say goodbye!

抓包OpenAI員工用自家的Claude Code開發,直接二話不説拔了OpenAI訪問Claude的網線。

只能説,Anthropic是真恨啊……

兩家公司的硝煙最近更是不藏了,這不前腳Anthropic剛發佈Claude Opus 4.1,后腳OpenAI就推出了GPT-5,還專門強調在編碼能力上做了優化,這目標是誰不言而喻。

Anthropic也沒示弱,反手就將Claude模型的上下文窗口擴大至100萬tokens,就是要壓倒你GPT-5。

這下OpenAI自己養大的狼,真成心腹大患了。

那麼就有人問了,OpenAI前員工離職創業成功的辣麼多,為啥偏偏是Tom Brown成了奧特曼的「眼中釘」?

嘿嘿,還得是因為這哥們是個不按常理出牌的野路子,AI全靠他自學,以及億點點OpenAI的提攜

自學生涯

那年他才21,剛剛從大學畢業,還有點迷茫,於是進入了朋友的YC初創公司上班。

從讀書時等待被投喂的狗到社會上必須與狼羣競爭,心態上的轉變讓他意識到,自己想要從事更宏大、更激動人心的事業。

他加入移動公司Mopub,想要做很多事,但苦於編程能力很差不知道怎麼做,不過好在最后還是學會了如何規模化發展業務。

自己創業,想做一個更靈活的DevOps (開發運維)平臺,結果説不清自己到底要做什麼,被YC面試官一頓痛批。

后來被YC聯合創始人Paul Graham介紹去做約會應用Grouper,模式就是幫三男三女在酒吧牽線約會。

也就是在這里,Tom Brown等到了一個機會,一個比他還喜歡在Grouper上約會的大佬——OpenAI聯合創始人Greg Brockman

據說他有整整一年,幾乎每天都在公司羣里,邀約其他人和他一起去Grouper約會,於是Tom成功搭上了這層人脈✅

不過后來Grouper業務被Tinder打擊到一落千丈,收入下滑、夢想破滅……Tom Brown徹底burnout(職業倦怠)。

他選擇離開Grouper,並嘗試轉型學習AI,但在Tom Brown自己的描述中,他當時其實也很猶豫:

這輩子,人類説不定能造出變革性AI,或許我能為此出點力,但AI研究必須是頂 級的超級天才,而我大學線性代數只拿了B-。

而且那時候AI研究還被視作不務正業,普遍都更傾向於做能實在落地的項目,他身邊的朋友也都不看好。

猶豫再三,他先給自己放了三個月的假,比如練練瑜伽、CrossFit,或者為藝術節造輛手工車,錢都花光后,終於決心六個月自學AI,目標進入當時的AI三巨頭DeepMindGoogle BrainMIRI

他先是和直播平臺Twitch簽了份短期合同,哼哧哼哧干了3個月,賺夠6個月的生活費后,給自己制定了一份自學計劃,包括:

學習Coursera上的機器學習課程

參加Kaggle項目

讀線性代數經典教材《Linear Algebra Done Right》以及一本統計學書籍

利用YC校友積分購買一塊GPU,通過SSH遠程完成課程作業和項目。

6個月閉關學習后,Tom Brown感覺神功既成,立馬聯繫大佬Greg Brockman:

特別想加入OpenAI,不管做什麼都行,哪怕是幫你們拖地,我也願意。

大佬也是珍惜人才,就幫他一對一制定了個自學課程,然后每個月都要求他匯報一次學習進展,然后過了幾個月,就讓他順勢進入OpenAI搭建《星際爭霸》項目的訓練環境。

不過據Tom所説,其實在OpenAI前九個月,他都沒做過任何機器學習相關工作,后來沒多久就跳槽去了Google Brain,專門設計ML系統的攻擊與防禦機制。

一年后等他回到OpenAI,他終於被委以重任,參與主導GPT-3構建,負責模型工程實現和部署。

GPT-3延續了GPT-2的Transformer架構,在Tom Brown的帶領下,完成了局部稀疏注意力、預正則化等模型設計改良,展現出優秀的少樣本能力。

其中的關鍵突破恰恰在於規模化計算,由Dario Amodei (Anthropic的另一位聯合創始人)發現的Scaling Laws,開始促使Tom Brown將工作重心轉移到計算資源上。

他是OpenAI經典論文《Language Models are Few-Shot Learners》的主要作者之一,負責訓練基礎設施,將模型參數規模從原來的15億擴展到了1700億,可以確保LLM在無需微調的情況下,通過少量示例,就能完成多種自然語言處理任務,如翻譯、問答、推理等任務。

已經在OpenAI內部如魚得水的他,卻因為使命感選擇了離開,作為OpenAI里專注於安全和規模化的核心團隊成員,他和整個團隊一起共同創立了Anthropic,希望可以認真對待AGI風險。

當初剛創立時,Anthropic只有七位聯合創始人,一百多個員工,資金也完全不能和OpenAI匹敵,困難重重的情況下終於打贏了這場漂亮的Claude翻身仗。

直到今天,他已經是Anthropic技術運營的中堅力量,不僅負責監督LLM訓練所需的GPU資源分配,也涉及AI安全架構、資源擴張策略等多層面。

誰能想到,就是這樣一個改變整個行業的風雲人物,曾經對AI也一竅不通,全靠自學,也能成才

給年輕人的5個建議

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。