繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

範式CEO戴文淵:AI兩極分化嚴重 絕大多數開發者不需要萬卡集羣

2026-01-28 13:25

  炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

(來源:雷遞)

雷遞網 樂天 1月28日

範式智能CEO戴文淵日前表示,當下幾千個不同的應用的落地都是在幫助英偉達的生態,99%以上的AI的工作都是做在英偉達的體系下。

「中美之間的AI競爭是99%都是在中國的中國人和在美國的中國人(華人)之間的競爭。但非常遺憾的一點,我們現在99%的,哪怕是在中國的中國人做的AI應用,也是英偉達體系下的,不是在國產的信創體系下。」

戴文淵指出,當前,大廠都説要搭萬卡集羣,搭10萬卡集羣。實際上,AI的兩極分化是非常嚴重,可能頭部的幾家大廠,他們覺得萬卡集羣都小了。但對於絕大多數的商業開發者來説,他們需要的不是萬卡,不是用1萬張卡去跑一個模型。他們需要的是能用一張卡去跑1萬個模型,否則,它的利用率就會非常低。

「當下,很多應用開發者用不掉一張卡,只能可能用1‱張卡。這不是萬卡,是1‱張卡。」戴文淵説,範式智能希望能夠和曦望攜手一起去打造百萬token一分錢的算力雲。

以下是範式智能CEO戴文淵演講實錄:

雷遞網創始人雷建平與範式智能CEO戴文淵合影

戴文淵:從去年開始,我看到國產算力的崛起。我從2009年開始在產業界做AI,一直以來做了很多的應用。我們範式到上市的那一天,我們統計了一下,我們大概做了22個不同的行業,做了幾千個不同的應用的落地。自豪之余,又有一些遺憾,這所有的應用都是在幫助英偉達的生態。

所以去年我和徐冰在聊到這件事情的時候,我説我們作為一箇中國的企業,我們應該要幫助信創產業能夠把生態做好。我們確實也有這方面的能力。所以我們應該干這件事情。當然,在干這件事情之前,我們也要看到這方面的差距,因為沒有差距就沒有我們的價值,也不需要我們做什麼。

很多人可能都是GPU公司的股東,買過寒武紀的股票,買過天數的股票,買過沐曦的股票。但是我不知道在座有多少人,除了曦望的同學,就是有多少人用過國產的GPU?

我們做個類比,想象一下,就假設你打開蘋果手機,你的app store里面有200萬個APP,你打開了另外一個華為的手機里面大概有50個APP, 那你是覺得這個手機是性能慢呢,還是覺得這個手機完全都沒法用,可能你都不會考慮這個手機的性能,也不會考慮這個手機的價格,你就直接就不用了。這是我們現在面臨的一個很大挑戰。

第二個就是90%,我覺得都是保守了。可能過去的大概有99%以上的AI的工作都是做在英偉達的體系下,我們現在説這個中國人挺自豪的,就是在中美之間的AI競爭是99%,都是在中國的中國人和在美國的中國人之間的競爭。甚至我們認為在中國,我們的AI人才多,我們做了很多AI的應用。未來我們在AI應用領域,我們應該跟美國比是有優勢的。

但是非常遺憾的一點,我們現在99%的,哪怕是在中國的中國人做的AI應用,也是英偉達體系下的,不是在國產的信創體系下。

第三個,我分享一個數字,大概20倍。英偉達的CUDA體系下的這個核心數是什麼核心數呢?什麼叫核心數?大家就可以認為算子的數量大概在18000個,國產的平均在幾百個。大概來説大概差20倍。

徐立總也講到GPU的利用率問題。我們現在很多的GPU集羣的利用率都是很低的。我前一段時間我和一個我們頂尖的央企在交流,他們搭了一個萬卡集羣,完了以后他們問我一個問題,他們説這個卡的性能都太強了。我們的應用開發者用不掉一張卡,甚至就用不掉一張卡,我們只能可能用1‱張卡。這不是萬卡,是1‱張卡。

這個可能有點反常識,因為我們看到大廠都説我們要搭萬卡集羣,我們搭10萬卡集羣。實際上,AI的兩極分化是非常嚴重,可能頭部的幾家大廠,他們覺得萬卡集羣都小了。但是對於絕大多數的商業開發者來説,他們需要的不是萬卡,不是用1萬張卡去跑一個模型。他們需要的是能用一張卡去跑1萬個模型,否則,它的利用率就會非常低。

最后,就是國產的性價比,這是我們繞不開的一個話題。我們雖然説去年國產的卡的銷量在迅速地提升,但是我們也必須承認,在去年銷量提升的原因不是因為國產卡的性價比高,而是因為國產的卡能夠解決安全性的問題。

很多企業買國產卡,是因為怕將來買不到英偉達的卡,所以我需要買一些國產卡作為plan b。實際上,絕大多數的國產卡現在宣稱的是英偉達的H100的百分之多少的性能,或者A100的百分之多少的性能。而不是説我們的性價比比英偉達的B300要高多少。所有的問題加起來是我們現在要做國產的算力所必須面對的問題。

當然,我們看到這些數字差距是比較大的,但是我們一定要相信中國人是能解決問題的。因為美國的這些很多工作也都是中國人做的,沒有道理在中國的中國人就做不了。

範式在過去幾年,我們在這些領域,我們一直致力於去幫助國產卡解決一些問題。為此我們也做了一些工作。比方説,我們在去年我們發佈了一個叫信創魔盒model hub XC,model hub信創。

我們致力於要打造的是叫作業界最大的信創的大模型社區,可以認為就叫作信創板的hugging face. 這個定義和中國的hugging face是有區別的。我們知道我們有很多社區,中國的社區定位叫中國的hugging face,在我看來中國的hugging face的價值不大。

因為中國的hugging face還是給英偉達用的,能做模型的人都知道hugging face在哪兒,不需要在中國再做一個鏡像了。中國真正需要的hugging face是信創的hugging face,這些模型是能跑在國產的GPU上面。

在去年9月份,我們發佈model hub x1的時候,我們的社區模型數量是0,到上周我們的模型數量大概是1萬多,現在我們比英偉達差兩個數量級。

但是我們為什麼對此非常有信心?因為我們的速度爬坡非常快。我們截至上周一共是一萬多個,但是上周我們適配了2500個,也就是説,我們上周適配了我們從九月份到現在的四分之一,我們能看到爬坡的速度,根據這個速度我們非常有信心能夠在今年能做到10萬以上的量級,做到比英偉達差一個數量級,到差一個數量級的時候。實際上我們可以認為國產的卡可能比英偉達卡稍微不好用一點。就好像蘋果手機假設有200萬個應用,如果華為手機有20萬個應用,你會覺得華為手機還是能用的,稍微有一點不好用。

我們今年的目標達到這個,到明年,我們希望我們用中國的開發者的力量,把我們的生態應用的豐富度能夠追上英偉達的社區。同時我們連續七年在打造市場份額第一的AI開發平臺。這是我們一直以來給到我們的市場,我們的客户的核心價值。

在過去的十幾年,我們也幫助了二十多個行業,去打造了近萬個垂直的模型。實際上垂直的模型也是非常重要的。我們知道去年十月份,OpenAI關閉了財務、法務、醫療的純專業問題的回答,這是為什麼呢?這是因為通用模型它在專業領域可能答得不夠好。對於這些垂直的問題,我們需要垂直的模型來進行更專業地回答。

最后,我們一直以來在打造一個叫什麼呢?叫honey社區VGPU社區。這個社區是全球最大的異構VGPU的社區。什麼叫異構?就是我們能支持我們的VGPU, 下面部署不同種類的卡,包括像英偉達,包括各種各樣的信創的卡,因為在GPU領域,大家是一個非常大的兩極分化,頭部的廠商需要搭建萬卡集羣,除了頭部的廠商,大家需要的是1‱張卡。這個時候GPU的虛擬機就是非常重要的技術。如果做不到GPU的虛擬機的技術,你是不可能去幫助廣大的客户去把GPU的利用率做上。

近期,我們也推出範式版的雲服務,叫作fancy cloud. 在這個fancy cloud我們提供的是基於國產的GPU上面打造一個國產的雲服務算力的雲服務,上面集成了我們的VGPU的技術,以及我們的開發平臺,我們的信創魔盒,在信創魔盒上面,此時此刻已經能夠給我們的雲服務的客户提供超過上萬個各種各樣的模型。

在今年我們力爭把這個數量提升到10萬量級以上,到明年我們要追上Huggingface,我們也提供了一個叫作fancy one one神殿模型。在這個fancy里面,我們要提供我們在各個領域積累的是垂直模型的能力。使用範式的fancy cloud. 實際上我們就能夠享用到源源不斷的國產算力的供給。我們能夠享用到範式過去積累的VGPU的能力,能夠幫助客户能更好地去提升GPU的利用率。同時我們也能夠基於fancy cloud能夠提供開發的能力,能夠提供市面上所有能夠去獲取到的大模型的能力,在國產的信創的算力上的調用。

最后也能夠享用到範式。在過去十幾年在二十多個行業的垂直模型的積累。這是我們希望我們能夠給市場提供核心能力。但是剛纔也看到,我們有一項我們沒有提到就是性價比。性價比不是一家軟件公司獨自能夠提供的。我們也非常高興能夠看到曦望的出現,曦望的出現,讓我們看到了國產算力和英偉達相比的性價比的機會。我們也非常高興今天能夠看到啟望S3的發佈,能夠看到百萬token一分錢的這樣的一個計劃。

我們也非常高興能夠參與到這個計劃,能夠和曦望攜手一起去打造百萬token一分錢的算力雲。我們曦望在中國,我們推出國產的算力,我們不僅僅是給我們各個市場的客户去解決他們的安全性問題。當然,安全性問題也很重要。除此之外,我們也希望中國的算力是全世界最便宜的。

今天我們希望和曦望一起藉着啟望S3的發佈,也希望未來S4S5的發佈,曦望一起去打造fancy cloud. 基於希望的fancy cloud, 一起為全世界提供最便宜的算力。

雷遞由媒體人雷建平創辦,若轉載請寫明來源。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。