熱門資訊> 正文
2025-10-16 09:06
本文來自格隆匯專欄:半導體行業觀察 作者:邵逸琦
2016年,當英特爾斥資約3.5億美元收購Nervana Systems時,這家芯片巨頭對人工智能市場的野心昭然若揭。
八年后,Nervana聯合創始人Naveen Rao正帶着一家名為Unconventional的新公司,目標估值50億美元,手握10億美元融資計劃,準備再次向英偉達發起衝擊。
這一次,他不再是大公司的附庸,而是以獨立創業者的身份,試圖用一種全新的計算架構改寫AI硬件市場的規則。
故事要從2014年説起。那一年,「人工智能」還是一個讓投資者皺眉的詞匯。
「當時,人工智能是一個骯髒的詞,」在肯塔基州長大的Naveen Rao回憶道,他的父母是印度移民。那時的AI被視為「某種失敗,一種拙劣的玩意兒」——一個深奧難懂、令人着迷的研究領域,在大學實驗室和科幻迷中引發熱烈討論,但不被認為具有任何實用價值或商業價值。
Rao與Amir Khosrowshahi、Arjun Bansal三人在高通公司相遇。他們都擁有神經科學博士學位——Rao和Bansal是布朗大學的同班同學,Khosrowshahi畢業於加州大學伯克利分校。三人都是科技迷和科幻迷,對《終結者》《黑客帝國》《神經漫遊者》等作品中關於智能機器的想象着迷。
「我們所有人都熱衷於當書呆子,」Rao説,「那些關於電腦因為智能而失控的電影總是讓我着迷。」對能夠像人類一樣思考的機器的痴迷,促使三人進入了神經科學領域——研究大腦的運作方式,而這也正是人工智能研究的核心。
在高通工作期間,他們開始談論創辦自己的公司。「我們聊了聊,」來自伊朗的移民Khosrowshahi説,這引出了更嚴肅的話題,關於「我們將如何打造機器學習處理器」。值得注意的是,Khosrowshahi出身於一個著名的技術專家和投資者家族:他的表弟Dara Khosrowshahi曾任Expedia首席執行官,現任Uber首席執行官,並在Nervana早期擔任過導師。
那時,三人清楚地意識到,以深度學習形式出現的人工智能正在蓬勃發展。他們瞄準了這項技術的一大障礙:硬件,特別是微處理器。深度學習涉及更繁重的計算任務,傳統的中央處理器難以輕松處理,而用於遊戲和高端圖形的圖形處理器,尤其是英偉達的GPU,性能要好得多。
「我們有所有這些想法,其中有一個非常實用的想法:我們可以設計製造芯片,」Khosrowshahi説。
他們得到了Khosrowshahi在加州大學伯克利分校的導師之一、紅木理論神經科學中心主任Bruno Olshausen的支持。當他們向Olshausen解釋計劃時,這位受人尊敬的神經科學家説:"你必須行動。你必須現在就行動。"
"他看到我們處於領先地位,甚至領先於其他所有人,"Khosrowshahi回憶道。Bansal指出,Olshausen"不是一個容易激動的人",所以他的熱情反應對他們來説意義重大。
但讓投資者興奮又是另一回事。2014年,當他們創立Nervana時,人們談論的是「機器學習」,而不是「人工智能」。Nervana的創始人經常談論另一個當時並不廣為人知的概念:深度學習。
深度學習是人工智能的一個分支,它使計算系統能夠通過人工神經網絡來模仿人類大腦的工作方式,這些神經網絡能夠拾取、記錄和處理數據和信號,然后以類似於人類記憶的方式組織信息。
Khosrowshahi的一些親戚告訴他:「我們寧願你別這麼做。」他們擔心人工智能是一項過於未來化的登月技術。此外,Nervana專注於一個通常會讓投資者感到不安的領域:硬件。「他們知道打造硬件的難度,」Khosrowshahi説。
但隨后,轉機出現了。谷歌於2014年初收購了總部位於倫敦的人工智能公司DeepMind,當時Nervana正處於創立階段。2016年,DeepMind憑藉其人工智能系統AlphaGo擊敗了圍棋世界冠軍,一舉引起國際轟動。圍棋是一種類似於國際象棋的複雜棋盤遊戲,計算機一直難以掌握。
「DeepMind的成立意義非凡,」Rao説道。它也幫助Nervana籌集了資金。Rao、Khosrowshahi和Bansal在首輪融資中籌集了60萬美元,這筆資金足以讓他們"辭去工作,租一間辦公室,僱人"。之后,他們又籌集了約2400萬美元。
突然間,人工智能成爲了人們關注的焦點。隨着人們越來越關注人工智能在聲控設備、自動駕駛汽車中所扮演的角色,這些技術總體上「從有趣的玩具變成了可以使用的東西」。
芯片是人工智能潮流的核心。英偉達抓住機遇,率先領先。芯片初創公司迅速加入競爭,打造專為人工智能設計的處理器。在這場競爭中,Nervana已然是先驅。
「這是一次幸運的意外,」出生於新德里、后來憑藉南加州大學全額獎學金來到美國的Bansal説道,「我們看到了可以超越圖形芯片進行優化的機會。」
到2015年末,越來越多的投資者對人工智能產生了興趣。「現在,每個人都在投資這個領域,」Rao打趣道。更重要的是Nervana團隊對初創企業領域的影響,現在人們更加關注硬件和芯片。
「打造硬件真的很難,」Khosrowshahi説,「但現在正值它的黃金時代。」
而此時的英特爾,正面臨着一個嚴峻的現實:在深度學習芯片市場,這家半導體巨頭正被勁敵英偉達擊敗,其在半導體領域的主導地位正在被削弱。
深度學習的崛起讓英偉達的GPU找到了新的用武之地。這些原本為遊戲和高端圖形設計的處理器,在處理深度學習所需的大規模並行計算時表現出色。英偉達迅速佔領了這個新領域,甚至開始將自己定位為一家人工智能科技公司。
「深度學習落到了他們的頭上,」Rao説道。現在,英特爾需要奪回失去的陣地。
英特爾首席執行官兼創始人Andy Grove有一句著名的口頭禪:「只有偏執狂才能生存。」這番話成爲了硅谷的戰鬥口號,強調了不斷尋找甚至痴迷於新的市場趨勢和威脅的重要性。2016年,Grove去世僅幾個月后,英特爾決定收購Nervana,試圖在這個芯片巨頭曾經缺乏足夠警惕的市場中實現反彈。
2016年,當Rao、Khosrowshahi和Bansal正尋求為Nervana籌集更多資金時,另一條道路出現了。Rao説,與英特爾的談判"很快就從融資轉向了收購談判"。
「將公司出售給英特爾對我們來説是件有點傷感的事,它是我們的寶貝,」Rao説。但被英特爾這樣的科技巨頭收購意味着獲得巨大的資源,這將給他們帶來巨大的優勢。
「英特爾擁有強大的技術資產,」Rao説道,「如果你把它應用到人工智能領域,我們就能獲得相當大的優勢。」
Khosrowshahi表示:「我們當時只是一支很小的團隊,來到了英特爾,而英特爾卻下了很大的賭注。」
英特爾最終以約3.5億美元收購了Nervana Systems,旨在打入深度學習訓練芯片市場。此前,這個市場一直由擁有更強大圖形處理單元的英偉達公司主導。英特爾的想法是,通過開發專門用於深度學習的專用集成電路,可以獲得超越英偉達的競爭優勢。
收購完成后,英特爾的人工智能平臺事業部由Rao領導,成員包括Nervana的許多前員工。這是英特爾對AI芯片市場的一次重大押注。
英特爾的人工智能部門已經推出了能夠運行人工智能系統的芯片。但真正的考驗將在稍后到來——一款名為英特爾Nervana的新處理器,這是這家科技巨頭首款從零開始打造的人工智能芯片,旨在處理人工智能所需的海量數據吞吐量。
Rao承認他們面臨的挑戰:「我們面對的是一個努力的競爭對手,而且他們很優秀。」英偉達一直在努力捍衞其領先地位,其首席執行官黃仁勛當時表示:「我們看到人工智能正在幾乎所有行業得到應用,從交通運輸到醫療保健,從零售到物流、工業、農業。」
2018年,英特爾在人工智能峰會上正式推出了Nervana神經網絡處理器——用於深度學習訓練的NNP-T1000和用於推理的NNP-I1000芯片,並宣佈下一代Movidius VPU將於2020年發佈。這些產品的開發源於英特爾2016年對Nervana和Movidius的收購。
Rao在聲明中表示:「隨着人工智能的下一階段發展,我們在計算硬件和內存方面正達到一個臨界點。像英特爾Nervana神經網絡處理器和Movidius Myriad視覺處理單元這樣的專用硬件對於人工智能繼續取得驚人的進步至關重要。」
英特爾當時宣稱,目前正在發售的這些芯片旨在為客户提供「系統級人工智能方法」,其中包括具有開放組件和深度學習框架集成的完整軟件堆棧。
NNP-T1000提供了「計算、通信和內存之間的適當平衡」,使其適用於從小型計算集羣到大型超級計算機的任何設備。Rao表示,NNP-T1000在ResNet-50和BERT等重要訓練模型上提供了95%的擴展能力,並且在32塊芯片上運行這些模型時性能幾乎不會下降。
爲了推動新芯片的推廣,英特爾開發了一種新的pod參考設計,該設計由10個機架和480塊NNP-T1000卡組成,這些卡使用英特爾的無膠結構互連。Rao表示:「這款ASIC專門設計用於分佈式訓練,無需切換。」
另一方面,NNP-I1000為客户提供了高效節能且預算充足的產品,可「使用靈活的外形尺寸在現實世界規模上進行密集的多模式推理」。Rao表示,與搭載英偉達T4推理GPU的服務器機架相比,運行NNP-I1000的服務器機架的計算密度幾乎提高了四倍。「我們擁有的是在單個機架單元中每秒可以進行最多推理的能力,」他説。
英特爾表示,Nervana芯片是爲了滿足社交媒體巨頭Facebook的人工智能處理需求而開發的。Facebook人工智能系統聯合設計總監Misha Smelyanskiy在聲明中表示:「我們很高興能與英特爾合作,利用英特爾Nervana神經網絡處理器部署更快、更高效的推理計算,並將我們最先進的深度學習編譯器Glow的支持擴展到NNP-I。」
據報道,英特爾曾預計其人工智能產品將在2019財年創造35億美元的銷售額,其希望新的Nervana和Movidius產品能夠延續這一勢頭,使其產品組合成為業內最廣泛的廣度和深度。
然而,好景不長。就在Nervana芯片發佈一年多后,2019年12月,英特爾宣佈以20億美元收購另一家AI芯片公司Habana Labs。這次收購為Nervana芯片的命運埋下了伏筆。
Habana Labs是一家總部位於以色列的初創公司,自主研發了兩款AI芯片:用於神經網絡訓練的Habana Gaudi和用於推理的Habana Goya。問題在於,這兩組芯片的用途與Nervana芯片大致相同——一個用於訓練,一個用於推理,過於雷同的定位,讓英特爾陷入了兩難的糾結。
事實上,在英特爾收購Habana時,分析師們就曾對Nervana芯片的未來進行過猜測。Moor Insights & Strategy分析師Karl Freund本人也表示,很難想象Nervana處理器會繼續在英特爾的產品組合中扮演重要角色。
原因之一是Habana芯片的性能遠超Nervana。在ResNet-50基準測試中,兩塊Nervana NNP-I芯片每秒可處理10,567個輸入。但在同一測試中,僅一塊Habana Goya芯片就能達到每秒14,451個輸入——性能差距接近1.4倍。Goya不僅性能更強大,而且自2018年以來已開始向客户發貨,而NNP-I尚未正式發佈。
2020年,Karl Freund在《福布斯》雜誌的一篇文章中披露,英特爾已決定停止Nervana神經網絡處理器的開發工作,轉而將精力集中在收購Habana Labs時獲得的人工智能芯片架構上。英特爾告知他,已決定終止Nervana NNP-T訓練芯片和Nervana NNP-I推理芯片的研發工作,但表示仍將履行對后者的客户承諾。
這意味着英特爾在AI芯片市場上為期四年的Nervana計劃宣告終結。從2016年3.5億美元的收購,到2018年的產品發佈,再到2020年的項目終止,Nervana在英特爾內部的生命周期不到四年。
放棄Nervana芯片的決定對英特爾的人工智能平臺事業部產生了重大影響。該事業部當時由Nervana Systems聯合創始人Naveen Rao領導,成員包括該公司的許多前員工。英特爾在2019年12月表示,計劃保留Habana作為一個獨立的業務部門,但很可能會將其與人工智能平臺事業部合併。
英特爾在這方面有先例,因為它曾在2017年以153億美元收購Mobileye后將其自動駕駛集團與該公司合併,儘管它仍將其保留為一個獨立的業務部門。
這是英特爾在AI芯片市場上的一次重大戰略調整。事實上上,Nervana的技術路線最終在與Habana的競爭中落敗了。對於Rao和他的團隊來説,這無疑是一次沉重的打擊——他們傾注心血打造的芯片,最終在母公司內部的競爭中敗下陣來。
Nervana項目終止后,Rao並沒有立即離開英特爾。但最終,他選擇了新的職業道路,加入了數據分析和人工智能平臺公司Databricks,擔任人工智能主管。
Databricks是一家成立於2013年的公司,由Apache Spark的原始開發者創立,專注於為企業提供統一的數據分析和人工智能平臺。在Databricks,Rao負責領導公司的AI戰略和產品開發,這讓他能夠從軟件和平臺的角度繼續深入AI領域。
在Databricks工作期間,Rao積累了更多關於AI應用層面的經驗和洞察。他看到了企業在部署AI應用時面臨的各種挑戰,也看到了現有硬件架構的侷限性。這些經歷無疑為他后來創立Unconventional埋下了伏筆。
但對於一個曾經試圖用專用芯片挑戰英偉達的人來説,在軟件平臺公司工作或許只是一個過渡期。Rao心中仍然懷揣着硬件夢想,仍然相信通過重新設計計算架構,可以為AI帶來根本性的突破。
今年10月,根據知情人士透露,Rao正在為一家名為Unconventional, Inc.的新創業公司洽談籌集10億美元,這家公司正在開發一種新型計算機,其目標估值為50億美元。
消息人士稱,Andreessen Horowitz已同意領投,Lightspeed和Lux Capital也參與了此次交易。彭博社報道稱,Databricks也正在投資Rao的新公司。據透露,Rao已經籌集了數億美元,並計劃在10億美元融資輪全部結束后立即着手打造這家初創公司。他計劃分期籌集剩余資金,這種融資方式通常被稱為"分期"融資。
50億美元的估值目標,遠超當年Nervana被收購時的3.5億美元。10億美元的融資規模,也遠超Nervana在被收購前籌集的約2500萬美元。這些數字表明,投資者對Rao的新項目寄予厚望,也反映了AI硬件市場在過去幾年間的巨大變化。
Rao拒絕置評,但他上周在X平臺上公開承認了這家新創業公司的存在,確認了公司的名稱,並將其預期產品描述為「重新思考計算機的基礎,構建一個與生物學一樣高效的智能新基礎。擺脫生物學包袱,實現大腦規模的效率」。
這段描述透露出幾個關鍵信息。首先,Unconventional不是在做漸進式的改進,而是試圖重新思考計算機的基礎——這是一個極其大膽的目標。其次,與生物學一樣高效暗示了神經形態計算或受大腦啓發的架構,這與Rao的神經科學背景高度契合。第三,擺脫生物學包袱意味着他們不是簡單地模仿大腦,而是要提取其效率原理並超越生物限制。
從Rao的背景來看,這個方向並不令人意外。他擁有神經科學博士學位,創立Nervana時就是從神經科學的角度思考如何構建更好的AI芯片。現在,他似乎想要更徹底地實現這一願景。
與2014年創立Nervana時相比,如今的AI硬件市場已經發生了翻天覆地的變化。
最顯著的變化是市場規模的爆炸式增長。2014年,投資者對AI硬件還持謹慎態度。如今,生成式AI的爆發讓AI芯片成爲了最炙手可熱的賽道之一。英偉達的市值突破4萬億美元,成為全球市值最高的公司之一,其數據中心業務(主要由AI芯片驅動)的季度營收已經超過數百億美元。
其次是競爭格局的變化。2014年,英偉達在AI芯片市場幾乎沒有競爭對手。如今,除了英特爾、AMD等傳統芯片廠商,還涌現出了大量AI芯片初創公司,包括Graphcore、Cerebras、SambaNova等。更重要的是,科技巨頭們紛紛自研AI芯片:谷歌有TPU,亞馬遜有Trainium和Inferentia,微軟正在開發Maia,Meta也在投資自研芯片。
第三是技術路線的多元化。早期的AI芯片主要聚焦於加速深度學習訓練和推理,現在則出現了更多創新方向:模擬計算、神經形態芯片、光子計算、量子計算等。這為新進入者提供了差異化競爭的機會。
第四是資本環境的變化。在生成式AI熱潮的推動下,投資者對AI硬件初創公司的興趣空前高漲。像Groq這樣的AI芯片初創公司能夠在短時間內籌集數億美元,估值達到數十億美元。Unconventional的50億美元估值目標,雖然雄心勃勃,但在當前的市場環境下並非不可想象。
然而,Rao和Unconventional面臨的挑戰也是前所未有的。
首先是英偉達的護城河已經變得更深。除了技術優勢,英偉達還建立了強大的軟件生態系統——CUDA平臺經過近二十年的發展,已經成為AI開發者的標準工具。任何新的AI芯片,如果不能提供與CUDA兼容或同等便利的軟件工具鏈,都很難獲得開發者的青睞。
其次是客户慣性。經過多年的發展,主要的AI應用都是基於英偉達GPU開發和優化的。要説服客户切換到新的硬件平臺,不僅需要顯著的性能或成本優勢,還需要完整的遷移方案和長期的技術支持承諾。
第三是製造和供應鏈的挑戰。先進的AI芯片需要最先進的製程工藝,這意味着要與臺積電等晶圓廠商建立合作關係,並在產能分配上與英偉達、蘋果、AMD等巨頭競爭。這對初創公司來説是一個巨大的挑戰。
第四是人才競爭。頂尖的芯片設計人才供不應求,科技巨頭和成功的初創公司都在高薪挖人。Unconventional需要組建一支世界級的團隊,這需要時間和資源。
但Rao也有自己的優勢。他有過完整的AI芯片創業經歷,知道哪些坑需要避免。他在英特爾的經歷讓他深入理解了大公司的運作方式和侷限性,而在Databricks的工作也讓他更瞭解AI應用的實際需求。
從某種意義上説,Rao的職業生涯形成了一個完整的敍事弧線。
2014年,他和兩位神經科學家伙伴創立Nervana,試圖用專用芯片挑戰英偉達的GPU霸主地位。那時AI還是一個"骯髒的詞",他們籌集了2500萬美元,被認為是瘋狂的賭博。
2016年,英特爾以3.5億美元收購Nervana,Rao成為這家芯片巨頭AI部門的領導者。他們開發出了Nervana NNP系列芯片,在某些指標上展現出了與英偉達競爭的潛力。
2020年,英特爾放棄Nervana芯片,轉向Habana的技術路線。這次失敗的經歷無疑是痛苦的,但也讓Rao更深刻地理解了在大公司體系內推動創新的困難,以及技術路線選擇的重要性。
現在,他帶着Unconventional重新出發,目標估值50億美元,手握10億美元融資計劃。這一次,他不再是被收購的創業者,不再需要在大公司的體系內妥協和權衡。他可以按照自己的願景,從零開始構建一種全新的計算架構。
而他的對手,依然是英偉達。只不過,這個對手已經比十年前強大了無數倍。英偉達的市值從2014年的百億美元級別,增長到了2024年的數萬億美元。其在AI芯片市場的份額超過80%,幾乎壟斷了數據中心AI訓練市場。黃仁勛已經成為科技界最有影響力的CEO之一,英偉達也從一家圖形芯片公司轉型為AI計算的代名詞。
但市場也比十年前大了無數倍。2014年,全球AI芯片市場規模只有數十億美元。到2024年,這個數字已經是數千億美元,並且還在快速增長。即使只能佔據這個市場的一小部分,也足以支撐起一家價值數十億甚至上百億美元的公司。
更重要的是,技術風向正在發生變化。過去十年,AI芯片的發展主要是在現有的馮·諾依曼架構基礎上進行優化——增加算力、擴展帶寬、提升並行度。但隨着AI模型規模的指數級增長,這種方式正在遇到物理極限和能效瓶頸。
這正是Rao所説的「重新思考計算機的基礎」的意義所在。如果Unconventional真的能夠開發出一種在能效比上實現數量級突破的新型計算架構,那麼它就有機會在這個看似被英偉達壟斷的市場中撕開一道口子。
注:本文來自半導體行業觀察《一位芯片老兵,再戰英偉達》;作者:邵逸琦