繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

勵算科技近期調研紀要

2025-09-07 20:20

(來源:君實財經)

轉發一篇8月4日的勵算科技調研紀要,值得一讀

2025年08月04日 09:44

廣東

團隊背景:S3從2002年成立,上海分公司,最多200-300人,主要做軟件、圖形API適配,當時從Windows98,做DirectX適配。中間經歷威盛(有x86授權)收購,和上海國資委成立兆芯,后又出來成立格蘭菲,后又到中天恆星,后2021年獨立出來自己干,現在在上海、南京,現在100人中肯定有至少10來個S3專家,這些人來礪算就是認可宣總。研發投入:融資6億,目前差不多消耗了這麼多,真正有效投入5億,中間有7-8個月處於經營很困難的狀態。流片1億,外部IP 1000w$(PCIe、GDDR等),其他是團隊運營費用(3億+)。

Q:怎麼理解低投入、高產出?

A:礪算的硬件團隊配置核心就20人左右,memory 2-3人,PCIe 2-3人,Codec 2-3人,GPU核心10人,這些不需要培養梯隊,下一代還是這一批人,但不能同時做兩代產品;軟件人多,也需要培養梯隊。不理解其他廠商為什麼投入這麼多,可能購買的IP是自己不熟悉的IP,需要從頭開始理解。其實GPU最大的投入在后期與客户適配。從零開始做軟件會比較難,但如果有經驗的話,100人做三年是可以做到兼容市面主流的圖形API。同時,GPU架構比CPU簡單,設計出一條管線,再複製,再做好核間通信等。

產品性能評判參數:摩爾線程S80比較高,8個IMG核處理器,面積比較大,功耗比礪算高,理論算力號稱14.4,等同4060,像素渲染和紋理填充也比較高,顯存搭配16G(同檔次產品是最高的);7G106顯存少4個G,算力17-18(遊戲一般用FP32精度),像素和紋理填充低於摩爾線程。因此參數上,摩爾線程>7G106>4060(4nm)。

效果:與參數反之,英偉達軟件效率體現在各方面,除了專業應用吃顯存,大多數遊戲也是4060效果比較好,7G106能做到85-95%,有時候能超過一點。專業應用上,7G顯存大,比4060好一點。摩爾線程差距更大,8個IMG核心拼湊起來,中間有通信效率問題,所以除了部分優化過的跑分和優化過的遊戲外,其他的不太好。我們認為他們出在軟硬件協同優化問題。

定價策略:成本高於英偉達,所以不太會犧牲太多利潤。摩爾當年起售價2999,送一個主板(主板900),可以理解為單卡2000。專家不是銷售,推測可能2000上下。專業級的版本會貴一些,顯存大,芯片大,對標英偉達A4000水平,價格估計類似。

市場推廣與競對兩類市場:1)消費級市場很難,不如英偉達,可能國內有些人會買,但不會成為主流消費。2)專業卡方面(信創升級版),會是比較好的市場,比如國產CAD、作圖、點雲處理。拓展方向和目標市場空間:專業方面(信創)的應用為主,消費級市場為輔。信創市場,目前國產卡往上、英偉達的卡往下有幾十萬卡的需求,這樣的話團隊規模翻倍也是可以實現盈虧平衡的。信創的八大行業有國產化需求,作圖、設計、虛擬現實、醫療CT,現在很多都在用英偉達、AMD,我們會做國產替代,摩爾線程/景嘉微現在達不到需求。

Q:聯想?A:肯定有,但不知道到什麼階段了。產品節奏:老闆説9月量產,如果9月初送過去,年底回片,1個月測試生產,春節前后就能出貨(在不delay的前提下)。

下一代目前還不清楚具體規劃,有可能26年底/27年纔會去推下一代。下一代產品方向:研發人員明年估計要加百十來人。下一代產品會命名為G200系列,架構會發生一定的變化,提升效率,軟件協同的過程中有發現一些更好的地方。軟件招人,應對應用軟件適配工作。

是否考慮做AI方向GPGPU?

臺積電300mm2已經限死,頂多4070Ti水平,目前沒聽到規劃搞GPGPU,除非回到國內。晶圓廠選擇:本來今年更早能回片,拖到現在就是因為中美原因,一開始要求不超過300,然后就各種查要求,后來封測白名單,遇到排產問題。國內流片渠道的考慮一直都有,但不到萬不得已不會去,產能緊張,良率低,在消費級市場很難競爭了。

現在這一代做AI訓練、推理的能力:

1)訓練肯定做不了,對卡間互連要求非常高,遠期也沒有規劃這方面能力。2)推理已經展示AI PC的功能,對DeepSeek也有支持,辦公沒有問題。3)我們完全支持OpenCL,對工業CV質檢類場景如果有人去開發也沒有問題。4)超分辨率(類似於英偉達DLSS)本身也是基於AI計算對於遊戲分辨率的提升,這方面也會有佈局。計算核心CUDA core負責通用計算,Tensor core負責AI處理。現在英偉達都比較融合了,CUDA core可以跑通用計算+AI處理,但是AI效率還是Tensor core更高。礪算也採用兩種core的架構,礪算的shader core相當於英偉達的CUDA core。后續提升是否等比例提升不知道,但大概率不會破壞原有比例。CUDA生態:沒有考慮適配CUDA,有些同事從AI GPU的公司過來的,他們反饋CUDA轉譯效率很低,工作量很大,也不是AI卡,所以把AI PC方面的功能支持好就行。

光追:聽説下一代會有,看面積會不會超。理論上4090以下的產品加光追沒什麼意義,下一代肯定也不會超過4090的水平。AMD被人詬病的掉驅動問題,礪算有遇到嗎?暫時無法回答,現在沒有掉,但后續開賣不保證。目前測試次數太少,需要百萬玩家去做才能發現這類問題。DLSS技術:公司類似DLSS的技術目前只能做2倍插幀,對標前兩代,也有拖影現象(AMD也有拖影,英偉達前兩代也有拖影,除非客户針對那個遊戲進行訓練,否則確實解決不了)。英偉達的水平需要強大的推理能力+軟件遊戲方面針對性的支持,我們現在只能先用通用模型(大量遊戲影像畫面訓練出來模型),去做插幀工作。3A實測:黑神話1080P下70幀,那個就是原始幀。開插幀應該不會那麼差,4K高畫質能做到40-50幀。實際使用建議開DLSS,肯定會更流暢,拖影問題只要不是那麼高清的顯示器、人盯着看,就不會影響。

網遊實測:有測試過,但不多,目前效果都還可以。一般來講3A能做好,網遊也可以。另外,一些網遊有反作弊系統,我們無法抓取里面的參數做分析,后續還是建立聯繫后合作才行。

Q:古墓麗影和黑神話兩款遊戲什麼樣的差別,導致我們產品實測效果有好有壞?

主要是引擎差異。黑神話用的是UE5(我們優化非常多),古墓麗影用的另一個引擎(我們沒怎麼優化)。老闆發佈會上選擇古墓麗影做測試,可能是想表達當年在哪里跌倒就在哪里爬起來。后續優化方向:主要問題就是出在生態方面,之前市面上基本上只有英偉達,所有軟件都基於英偉達做優化。我們用户量太小,別人一開始不會主動找我們做適配。假設賣給國內圖形軟件公司,我們一個一個去找,至少找50家公司先一一優化,纔會有更多公司來主動找我們優化。遊戲軟件也是一個道理,但更難的點在於,專業軟件就那幾個,但遊戲有幾萬個,不像中望CAD只吃OpenCL,遊戲有不同引擎(UE5、Unity等),還有些公司在國外,比較困難,現在只能先針對UE5優化,因為UE5部分是開源的。

生態方面,以下兩個維度的事情做好,90%的工作就做完了。1)圖形API的角度,只需要做到兼容了就行,目前市面上用的就是DirectX(市面上DX支持到10/11/12就可以,不需要支持更早版本)、OpenCL、OpenGL、Vulkan,所見即所得。礪算已經全部支持。2)引擎層(在圖形API上層)的角度,引擎層面理論上都可以支持,只是效率高低的問題。第一檔是UE、Unity,第二檔是大遊戲廠商自己的引擎(索尼、育碧、EA、動視),第三檔是小遊戲。需要很多年,沒有三五代產品,很難和英偉達掰手腕

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。