勵算科技近期調研紀要

2025-09-07 20:20

聲網(API) 0
國際紙業(IP) 0
PIMCO Dynamic Credit & Mortgage Income Fund(PCI) 0

（來源：君實財經）

轉發一篇8月4日的勵算科技調研紀要，值得一讀

2025年08月04日 09:44

廣東

團隊背景：S3從2002年成立，上海分公司，最多200-300人，主要做軟件、圖形API適配，當時從Windows98，做DirectX適配。中間經歷威盛（有x86授權）收購，和上海國資委成立兆芯，后又出來成立格蘭菲，后又到中天恆星，后2021年獨立出來自己干，現在在上海、南京，現在100人中肯定有至少10來個S3專家，這些人來礪算就是認可宣總。研發投入：融資6億，目前差不多消耗了這麼多，真正有效投入5億，中間有7-8個月處於經營很困難的狀態。流片1億，外部IP 1000w$（PCIe、GDDR等），其他是團隊運營費用（3億+）。

Q：怎麼理解低投入、高產出？

A：礪算的硬件團隊配置核心就20人左右，memory 2-3人，PCIe 2-3人，Codec 2-3人，GPU核心10人，這些不需要培養梯隊，下一代還是這一批人，但不能同時做兩代產品；軟件人多，也需要培養梯隊。不理解其他廠商為什麼投入這麼多，可能購買的IP是自己不熟悉的IP，需要從頭開始理解。其實GPU最大的投入在后期與客户適配。從零開始做軟件會比較難，但如果有經驗的話，100人做三年是可以做到兼容市面主流的圖形API。同時，GPU架構比CPU簡單，設計出一條管線，再複製，再做好核間通信等。

產品性能評判參數：摩爾線程S80比較高，8個IMG核處理器，面積比較大，功耗比礪算高，理論算力號稱14.4，等同4060，像素渲染和紋理填充也比較高，顯存搭配16G（同檔次產品是最高的）；7G106顯存少4個G，算力17-18（遊戲一般用FP32精度），像素和紋理填充低於摩爾線程。因此參數上，摩爾線程＞7G106＞4060（4nm）。

效果：與參數反之，英偉達軟件效率體現在各方面，除了專業應用吃顯存，大多數遊戲也是4060效果比較好，7G106能做到85-95%，有時候能超過一點。專業應用上，7G顯存大，比4060好一點。摩爾線程差距更大，8個IMG核心拼湊起來，中間有通信效率問題，所以除了部分優化過的跑分和優化過的遊戲外，其他的不太好。我們認為他們出在軟硬件協同優化問題。

定價策略：成本高於英偉達，所以不太會犧牲太多利潤。摩爾當年起售價2999，送一個主板（主板900），可以理解為單卡2000。專家不是銷售，推測可能2000上下。專業級的版本會貴一些，顯存大，芯片大，對標英偉達A4000水平，價格估計類似。

市場推廣與競對兩類市場：1）消費級市場很難，不如英偉達，可能國內有些人會買，但不會成為主流消費。2）專業卡方面（信創升級版），會是比較好的市場，比如國產CAD、作圖、點雲處理。拓展方向和目標市場空間：專業方面（信創）的應用為主，消費級市場為輔。信創市場，目前國產卡往上、英偉達的卡往下有幾十萬卡的需求，這樣的話團隊規模翻倍也是可以實現盈虧平衡的。信創的八大行業有國產化需求，作圖、設計、虛擬現實、醫療CT，現在很多都在用英偉達、AMD，我們會做國產替代，摩爾線程/景嘉微現在達不到需求。

Q：聯想？A：肯定有，但不知道到什麼階段了。產品節奏：老闆説9月量產，如果9月初送過去，年底回片，1個月測試生產，春節前后就能出貨（在不delay的前提下）。

下一代目前還不清楚具體規劃，有可能26年底/27年纔會去推下一代。下一代產品方向：研發人員明年估計要加百十來人。下一代產品會命名為G200系列，架構會發生一定的變化，提升效率，軟件協同的過程中有發現一些更好的地方。軟件招人，應對應用軟件適配工作。

是否考慮做AI方向GPGPU？

臺積電300mm2已經限死，頂多4070Ti水平，目前沒聽到規劃搞GPGPU，除非回到國內。晶圓廠選擇：本來今年更早能回片，拖到現在就是因為中美原因，一開始要求不超過300，然后就各種查要求，后來封測白名單，遇到排產問題。國內流片渠道的考慮一直都有，但不到萬不得已不會去，產能緊張，良率低，在消費級市場很難競爭了。

現在這一代做AI訓練、推理的能力：

1）訓練肯定做不了，對卡間互連要求非常高，遠期也沒有規劃這方面能力。2）推理已經展示AI PC的功能，對DeepSeek也有支持，辦公沒有問題。3）我們完全支持OpenCL，對工業CV質檢類場景如果有人去開發也沒有問題。4）超分辨率（類似於英偉達DLSS）本身也是基於AI計算對於遊戲分辨率的提升，這方面也會有佈局。計算核心CUDA core負責通用計算，Tensor core負責AI處理。現在英偉達都比較融合了，CUDA core可以跑通用計算+AI處理，但是AI效率還是Tensor core更高。礪算也採用兩種core的架構，礪算的shader core相當於英偉達的CUDA core。后續提升是否等比例提升不知道，但大概率不會破壞原有比例。CUDA生態：沒有考慮適配CUDA，有些同事從AI GPU的公司過來的，他們反饋CUDA轉譯效率很低，工作量很大，也不是AI卡，所以把AI PC方面的功能支持好就行。

光追：聽説下一代會有，看面積會不會超。理論上4090以下的產品加光追沒什麼意義，下一代肯定也不會超過4090的水平。AMD被人詬病的掉驅動問題，礪算有遇到嗎？暫時無法回答，現在沒有掉，但后續開賣不保證。目前測試次數太少，需要百萬玩家去做才能發現這類問題。DLSS技術：公司類似DLSS的技術目前只能做2倍插幀，對標前兩代，也有拖影現象（AMD也有拖影，英偉達前兩代也有拖影，除非客户針對那個遊戲進行訓練，否則確實解決不了）。英偉達的水平需要強大的推理能力+軟件遊戲方面針對性的支持，我們現在只能先用通用模型（大量遊戲影像畫面訓練出來模型），去做插幀工作。3A實測：黑神話1080P下70幀，那個就是原始幀。開插幀應該不會那麼差，4K高畫質能做到40-50幀。實際使用建議開DLSS，肯定會更流暢，拖影問題只要不是那麼高清的顯示器、人盯着看，就不會影響。

網遊實測：有測試過，但不多，目前效果都還可以。一般來講3A能做好，網遊也可以。另外，一些網遊有反作弊系統，我們無法抓取里面的參數做分析，后續還是建立聯繫后合作才行。

Q：古墓麗影和黑神話兩款遊戲什麼樣的差別，導致我們產品實測效果有好有壞？

主要是引擎差異。黑神話用的是UE5（我們優化非常多），古墓麗影用的另一個引擎（我們沒怎麼優化）。老闆發佈會上選擇古墓麗影做測試，可能是想表達當年在哪里跌倒就在哪里爬起來。后續優化方向：主要問題就是出在生態方面，之前市面上基本上只有英偉達，所有軟件都基於英偉達做優化。我們用户量太小，別人一開始不會主動找我們做適配。假設賣給國內圖形軟件公司，我們一個一個去找，至少找50家公司先一一優化，纔會有更多公司來主動找我們優化。遊戲軟件也是一個道理，但更難的點在於，專業軟件就那幾個，但遊戲有幾萬個，不像中望CAD只吃OpenCL，遊戲有不同引擎（UE5、Unity等），還有些公司在國外，比較困難，現在只能先針對UE5優化，因為UE5部分是開源的。

生態方面，以下兩個維度的事情做好，90%的工作就做完了。1）圖形API的角度，只需要做到兼容了就行，目前市面上用的就是DirectX（市面上DX支持到10/11/12就可以，不需要支持更早版本）、OpenCL、OpenGL、Vulkan，所見即所得。礪算已經全部支持。2）引擎層（在圖形API上層）的角度，引擎層面理論上都可以支持，只是效率高低的問題。第一檔是UE、Unity，第二檔是大遊戲廠商自己的引擎（索尼、育碧、EA、動視），第三檔是小遊戲。需要很多年，沒有三五代產品，很難和英偉達掰手腕

勵算科技近期調研紀要

推薦文章

美股機會日報 | 金價年內或觸及3800美元？國際大行集體唱多黃金！超微電腦漲超5%

一周財經日曆 | 萬衆矚目！9月美聯儲利率決議來襲；三隻港股新股即將上市

能否趕上美聯儲下周議息會議？美參院就米蘭理事提名錶決時間定了

港股異動 | 重磅利好！阿里漲近7%，百度漲超6%

華盛早報 | 創近4年新高！阿里大漲8%；外資熱情勢不可擋！大摩：超九成美國投資者願加倉中國資產

美股機會日報 | 美國8月CPI符合預期，初請失業金人數創近四年新高！「網紅股」Opendoor股價大漲超30%

萬億南向「活水」瘋狂搶籌！重倉阿里巴巴逾1200億港元，如何抄「聰明錢」的作業？

降息預期壓倒經濟隱憂！調查顯示：美股今年有望強勢收官