繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

李沐創業這一年:張一鳴宿華給建議,黃仁勛幫忙搞卡,逃離地獄模式后要做「人類陪伴的智能體」

2024-08-15 10:39

這幾乎是迄今最真誠和乾貨滿滿的大模型創業覆盤。

2024年8月14日晚上,李沐在他自己運營的B站和知乎專欄里發佈了一篇創業一年的覆盤文章:《創業一年,人間三年》,分享了他大模型創業第一年的進展、糾結和反思。

在文章中他回顧了自己創業的歷程:

從最初有創業的想法想做大模型的生產力工具,到遇到張一鳴被對方「點醒」,決定直接做模型本身;

到融資過程里被「放鴿子」,因首次創業而有些「縮手縮腳」沒能像一些同行那樣「拿10億現金」;

到直接聯繫黃仁勛獲得對方直接「安排」的H100,但卻發現這些卡在訓練中bug一堆;

再到最終磕磕絆絆找到商業化盈虧平衡的方法,並繼續朝着「人類陪伴的智能體」的目標前進。

李沐在分享自己直接踩過的坑的同時,也在這一年里不停問着自己:「到底為什麼要創業」。他被宿華「質問」,從蔡浩宇對他公司的不經意點評里獲得啓發,而最終他對於這個問題給出的答案非常李沐:

如果今天再來回答這個問題,我會説:「我就是腦子抽了」。

但是他也説,「我深層的動機來自對生命可能沒有意義的恐懼。」

「那麼一個人的存在的意義是什麼呢?小時候曾因為想不清這個問題而抑郁。所以我想去創造價值,獲得存在的意義。我選擇「上進」,去提升自己的創造價值的能力;選擇錄長視頻和寫教材,創造教育價值;選擇去寫讀博、工作、創業的總結,描述里面的糾結和困難,創造真實案例的價值;選擇去創業,團結很多人的力量去創造更大價值。」

以下是李沐的覆盤全文,文章轉載自李沐。括號里編者注為一些補充信息:

給小夥伴匯報一下LLM創業第一年的進展、糾結和反思

在Amazon呆到第五年的時候就想着創業了,但被疫情耽擱了。到第7年半的時候,覺得太癢了,就提了離職。現在想來,如果有什麼事這一輩子總要試下的,就蹭早。因為真開始后會發現有太多新東西要學,總感嘆為啥沒能早點開始。

李沐是AI領域知名學者,2023年離開亞馬遜創辦了Boson.ai。此前他擔任亞馬遜首席科學家,是人工智能框架Apache MXNet作者之一。他本科就讀於上海交通大學,卡耐基梅隆大學博士畢業,並先后在伯克利、斯坦福大學擔任教職。他在B站上持續更新《跟李沐學AI》的系列視頻,目前有80萬粉絲,這讓他被很多AI領域的年輕人稱為他們的「賽博導師」。

名字:BosonAI的來源

創業前做了一系列用Gluon命名的項目。在量子物理里,Gluon是把夸克綁在一起的一種玻色子,象徵這個項目一開始是Amazon和Microsoft的聯合項目。當時項目經理拍拍腦袋名字就出來了,但取名對程序員來説很困難,我們每天都在糾結各種文件名和變量名。最后新公司乾脆就用玻色子(Boson)來命名了。希望大家能get到「Boson和費米子組成了世界」這個梗時會會心一笑。但沒料到很多人會看成Boston。

「我來波士頓了,找個時間碰碰?」 「哈?可我在灣區呀 」

融資:簽字前一天領投方跑路

22年年底的時候想到兩個用大語言模型(LLM)做生產力工具的想法。碰巧遇到張一鳴,就向他請教。討論之后他反問:為什麼不做LLM本身呢?我的下意識退縮:我們之前在Amazon的團隊做了好幾年這個,得上萬張卡,和blabla這麼一大堆困難。

一鳴呵呵表示:這些都是短期困難,眼光得看長遠點。

我的優點是聽勸,真就去做LLM了。湊齊了數據、預訓練、后訓練、和架構各方向負責人的創始團隊,就去融資了。運氣不錯,很快拿到了種子投資。但錢還不夠買卡,得去拿第二輪。這一輪領頭是一家非常大的機構,做了幾個月文檔、商討條款。但在簽字前一天,領頭説不投了,直接導致了跟投的幾家退出。很感激剩下的投資方,還是做完了這一輪,拿到了做LLM的入場券。

今天反思的話,當時趁着資本市場熱情還在,其實可以繼續融資,説不定也跟其他友商一樣,現在十億現金在手。當時擔心融資太多,會不好退出,或者被架到天上去了。現在想來,創業就是想逆天改命,想什麼退路呢?

機器:第一批吃螃蟹的人

有了錢后就去買GPU。問各個供應商,統一回復是H100交貨得一年以后了。靈機一動,直接給老黃寫郵件。老黃秒回説他來看下。一個小時后超微的CEO就打電話過來了。多付了些錢,插了個隊,20天后拿到了機器。很榮幸早早的吃到了螃蟹。

這不是李沐第一次給老黃發郵件了,以前他就干過在NIPS的閉門活動給老黃發郵件帶研究員朋友去「開后門」參加論壇的事。在他的「粉絲」間一直流傳着他是隨時可以跟老黃吃便飯的人

螃蟹吃到懷疑人生,遇到了各種匪夷所思的bug。例如GPU供電不足導致不穩定,后來靠超微工程師修改bios代碼打上補丁;例如光纖的切開角度不對,導致通訊不穩定;例如Nvidia的推薦網絡佈局不是最優,我們重新做一個方案,后來Nvidia自己也採用了這個方案。至今我都不理解,我們就買了不到一千張卡,算小買家吧。但我們遇到的這些問題,難道大買家沒遇到嗎,為啥需要我們的debug?

在和業內有些人討論時,發現有些人已經「回答」了李沐:很多大廠更早經歷這些問題,他們並沒有把這些問題和解決方案反饋,而是做為一種技術門檻來對待了。把bug留給競爭對手們。

同時我們還租了同樣多的H100,一樣是各種bug,GPU每天都出問題,甚至懷疑是不是這個雲上就我們一個吃螃蟹的。后來看到Llama 3的技術報告説他們改用H100后,訓練一次模型被打斷幾百次,對字里行間的痛苦,很是共情。

如果對比自建和租卡的話,租三年成本和自建成本差不多。租卡的好處是省心。自建的好處有兩個。一是三年后如果Nvidia技術還遙遙領先,那麼它能控制價格使得GPU仍然保值 。另一個是自建的數據存儲成本低。存儲需要跟GPU比較近,不管是大雲還是小GPU雲,存儲價格都高。但一次模型訓練可以用幾TB空間存checkpoint,訓練數據存儲是10PB起跳。如果用AWS S3的話,10PB一年兩百萬。這錢用來自建的話,可以上100PB。

商業:感恩客户,第一年收支平衡

非常幸運的,我們第一年收入和支出是打平的。

我們支出主要在人力和算力上,感謝Openai的財力和Nvidia的遙遙領先,這兩項支出都挺大的 。我們的收入來源是給大客户做定製的模型。很早就上LLM的公司大都是因為CEO非常有決策力,他們沒被高昂的算力和人力成本嚇到,果斷的去推動內部團隊配合嘗試新技術。非常感恩客户給了我們喘氣的時間,不然這個幾個月我又是奔波在各個投資人那里。

接下來應該會有更多公司去嘗試使用LLM,不論是自己產品的升級,還是降本增效。原因是一方面技術成本在降低,另一方面行業領先者(例如我們客户)會陸續放出基於LLM的產品出來,把行業捲了起來。

我們也在關注LLM在toC上的落地。上一波頂流例如c.ai和perplexity還在找商業模式,但也有小十來家LLM原生應用收入還不錯。我們給一家做角色扮演的創業公司提供了模型,他們主打深度的玩家,打平了收入和支出,也是厲害的。模型能力還在進化,更多模態(語音、音樂、圖片、視頻)在融合,相信接下來還會有更有想象力的應用出現。

整體來説行業和資本還是急躁的。今年好幾家成立一年多但融資上十億的公司選擇退出。從技術到產品是一個很長的過程,花2、3年實屬正常。算上用户的需求的涌現,可能得花更長時間。我們專注當下在迷霧中探路,對未來保持樂觀。

商業化幾乎是所有LLM公司頭上懸着的利刃,李沐輕描淡寫就透露了公司已經收支平衡。BosonAI的第一年選擇了兩類生意,給大客户做模型定製,和給創業公司們提供基座模型。其實這個思路很務實,哪有錢就去哪。被投資人放鴿子的經歷對李沐的商業化選擇看起來也有影響,希望自己能「養活」自己,為技術的進步爭取時間和空間。

技術:LLM認知的四個階段

對LLM的認知經歷了四個階段。第一階段是Bert到GPT3,感受是新架構,大數據,這個可以搞。我們在Amazon的時候也是第一時間去做了大規模的訓練和在產品上的落地。

第二階段是剛創業的時候GPT4了放出來,大受震撼。大半原因來自技術不公開了。根據小道消息估算一次模型訓練一個億,標數據成本幾千萬。很多投資人問我復現GPT4成本得多少,我説3-4億要把。后來他們中一家真一把投了大幾億出去。

第三階段是創業的第一個半年。我們做不動GPT4,那就想着從具體的問題出發吧。於是開始找客户,有遊戲的、教育的、銷售的、金融的、保險的。針對具體的需求去訓練模型。一開始市面上沒有好的開源模型,我們就從頭訓練。后來很多很好的模型出來了,降低了我們成本。然后針對業務場景設計評估方法,標數據,去看模型哪些地方不行,針對性提升。

半年,Boson從閉源快速轉為開源,一切從效果和客户出發。反而越是像李沐這樣對AI發展理解更深的從業者,在這個階段越不在乎所謂開源閉源的爭論。

23年年底時,驚喜發現我們的Photon(Boson的一種)系列模型在客户應用上的效果都打贏GPT4了。定製模型的好處是推理成本是調用API的1/10。雖然今天API已經便宜很多,但我們自己技術也同樣在進步,仍然是1/10成本。另外,延時等都可以更好的控制。這個階段的認知是對於具體應用,我們是可以打贏市面最好模型的。

第四階段是創業的第二個半年。雖然客户拿到了合同里要的模型,但還不是他們理想中的東西,因為GPT4還遠不夠。年初時發現針對單一應用訓練,模型很難再次飛躍。回過頭想,如果AGI是達到普通人類水平,客户要的是專業人士的水平。遊戲要專業策劃和專業演員、教育要金牌老師、銷售要金牌銷售、金融保險要高級分析師。這都是AGI加上行業專業能力。雖然當時我們內心對AGI充滿敬畏,但感覺是避不開的。

年初我們設計了Higgs(上帝粒子,Boson的一種)系列模型。主打通用能力緊跟最好的模型,但在某個能力上突出。我們挑選的能力是角色扮演:扮演虛擬角色、扮演老師、扮演銷售、扮演分析師等等。24年年中的時候迭代到第二代,在測試通用能力的Arena-Hard和AlpacaEval 2.0上,V2跟最好的模型打得有來有回,在測試知識的MMLU-Pro上也沒差很遠。

Higgs-V2是基於Llama3 base,然后做了完整的post-training。我們沒資源像Meta那樣花大錢標註數據,所以V2比Llama3 Instruct好,原因應該還是主要來自算法的創新。

然后我們做了個評估角色扮演的評測集,包含按照人設扮演,和按照場景扮演。怪不好意思是自己的模型在自己的榜單上拿了第一。但模型訓練中是沒有碰評測用的數據。因為這個評測集是想自用,希望能真實反映模型能力,所以要避免模型overfit數據集。但做評測集的同學想寫技術報告,所以乾脆放出來了。有意思的是,按角色扮演的測試樣本來自c.ai,但他們家的模型能力是墊底的。

第四階段的認知是,好的垂直模型通用能力也不能弱,例如reasoning,instruction following這些能力垂直上也是需要的。長遠來看,通用和垂直模型都得朝着AGI去。只是垂直模型可以稍微偏科一點,專業課高分,通用課還行,所以研發成本稍微低一點,研發方式也會不太一樣。

那第五階段認識呢?現在仍在進行中,希望能很快分享。

願景:人類陪伴

説來慚愧,我們矇頭做技術,給客户做定製,然后再慢慢想我們自己追求什麼願景。我們去看客户想要什麼、我們自己想要什麼、未來可能需要什麼。我自己的話,多年前我憧憬有個機器人保姆能幫我帶娃、陪他們,因為干這個我覺得很難,而且也不太理解娃當前的認知和想法。

我希望工作上有個非常厲害的虛擬助手能跟我一起發明新的東西。等我老了也想有很有意思的機器人陪着。我對於未來的預測是,生產工具越來越發達,一個人完成之前一個團隊才能完成的事情,導致人類更加個體獨立,大家都忙着追求自己的事情,從而更加孤獨。

這些綜合在一起,我們把願景定成了「人類陪伴的智能體」。一個情商很高的,智商在線的智能體。算換成現實中的人的話,應該會是一個專業團隊。例如你想讓它陪你玩,那它是專業策劃+演員。陪你運動,那麼鼓勵師+專業運動教練。陪你學習,那麼能把你不懂的講懂。模型的好處是,它能做長期的陪伴,真的瞭解你。而且可以「真心為你」。

不過目前技術離願景還挺遙遠。當下技術就能陪着聊聊。很多場景下聊得也不是那麼好,內容匱乏,智商情商有時都不在線。都是當下要解決的問題。如果有小夥伴做這一塊的海外應用,歡迎聯繫我們。

團隊:有挑戰的事情得靠團隊

創業之后才真正覺得團隊的重要性。在大廠的時候,覺得自己是個螺絲釘,團隊成員是螺絲,甚至團隊也是個螺絲釘。但創業團隊就是一輛車。車小點,但能跑,能載重,轉彎靈活,各個角落都能去。公司成立不久的時候,米哈遊老蔡來看了眼,看見所有人在一間房子里,他感慨説小團隊真好。

兩人是上海交大校友,李沐是2004級本科,蔡浩宇2005級本科,且都留校讀了研究生

不方便的地方當然也是有的,時刻要看有沒有油,不好走的路得小心別把車震散架了。每個成員都很重要,沒有冗余,一個人不給力,就可能是一個輪胎沒氣。人也寶貴,走一個人就可能少一個輪胎。

以前我選項目會選自己能主導開發的。但這也意味着問題不會超出我能力太多。創業選了個很大的問題去做,只能全靠團隊了。別看本文里用了大量的「我」,其實工作都是團隊做的。沒了團隊,我可能得轉行去賣課了(此處不需要掌聲)。

李沐在B站上的AI課程是中文互聯網里最受歡迎的課程。很多人把他稱為「素未謀面的導師」。這些課程通俗易懂,充滿耐心且經常分享行業八卦。

個人追求:名還是利?

到目前為止我都靠跟着內心的聲音做決定,工作后再去讀博、去做視頻、去創業。創業需要強烈動機的支撐,才能克服層出不窮的困難。這需要對自己的動機做更深入的分析。

動機要麼來自慾望,要麼來自恐懼。十年前我可能更熱衷名利,但到了現在的年紀,覺得金錢的邊際效用已經不高,名聲帶來的情緒價值也已經很小。我深層的動機來自對生命可能沒有意義的恐懼。先不説宇宙的浩瀚,就是在人類的歷史長河,一個人也只是一粒沙。意外的到來,迅速的消失。地球上生活過一千億人,絕大部分人不會在歷史上留下痕跡。我家家譜上那上千個人名,我幾乎都不認識。

那麼一個人的存在的意義是什麼呢?小時候曾因為想不清這個問題而抑郁。所以我想去創造價值,獲得存在的意義。我選擇「上進」,去提升自己的創造價值的能力;選擇錄長視頻和寫教材,創造教育價值;選擇去寫讀博、工作、創業的總結,描述里面的糾結和困難,創造真實案例的價值;選擇去創業,團結很多人的力量去創造更大價值。

后記

去年跟宿華在斯坦福散步,他拍着我肩膀説:「跟我説句實話,你為什麼想創業呀?」當時候不以為然:「就是想換個事情做做」。然后宿華笑了笑。

現在我懂了,因為他經歷了創業酸甜苦辣。如果今天再來回答這個問題,我會説:「我就是腦子抽了」。但也慶幸當時沒想到會那麼不容易,所以一頭扎進來了。否則,大家看到的可能是「工作十年反思」。我覺得我今天寫的故事更有意思些。

致敬所有創業人。

知乎原文鏈接:

https://zhuanlan.zhihu.com/p/714533901

本文來自微信公眾號「硅星人Pro」,作者:王兆洋,36氪經授權發佈。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。