简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

DeepSeek发布新模型,寒武纪、华为快速适配!国产算力产业链崛起

2025-09-30 15:54

(来源:光大证券投研小分队)

DeepSeek升级新模型国产算力再迎机遇

根据DeepSeek官方信息929公司发布DeepSeek-V3.2-Exp模型821发布DeepSeek-V3.1之后DeepSeek明显加快大模型升级的速度两个版本间隔时间仅有30

DeepSeek引入了稀疏注意力机制可以提升长文本处理效率同时公司下调了API价格幅度超过50%

不仅如此寒武纪华为科技巨头迅速适配DeepSeek新模型标志着国产算力产业链实现了高效协同

关注【光大快评】,紧跟财经热点!

1、DeepSeek-V3.2-Exp模型发布,国产大模型能力又提升

929DeepSeek正式发布DeepSeek-V3.2-Exp模型这是一个实验性版本当前官方APP网页端均已更新至最新模型

DeepSeek-V3.2-Exp模型最大看点是,DeepSeekV3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(DSA稀疏注意力机制)

根据DeepSeek同步公开的论文,所谓的稀疏注意力机制混合注意力架构(MLA)基础之上稀疏注意力机制替代密集注意力,实现先筛选计算进而可以提升长文本理解能力DSA引入了组件闪电索引器可以判断出哪些历史token相对于当前token更加关键然后选择这些关键token进行计算这就带来核心注意力计算难度大幅下降从而极大提升了长文处理效率

DeepSeek表示,DSA首次实现了细颗粒度稀疏注意力机制几乎不影响大模型输出效果的前提下大幅提升了长文本训练推理效率

为了方便用户对比测试DeepSeek临时保留了DeepSeek-V3.1-Terminus额外的API访问接口,该接口将保留到北京时间2025年10月15日23:59

新模型开发过程中DeepSeek使用了高级语言Tilelang进行快速原型开发本次开源的主要算子包括TilelangCUDA两种版本

受益于新模型成本下降DeepSeek再次大幅下调API价格成本下降50%输入成本降幅达到50%-60%,缓存命中价格为0.2/百万tokens(下降60%),缓存未命中价格为2/百万tokens(下降50%)输出价格3/百万tokens之前大幅下降75%

8月21日,DeepSeek官方发布V3.1模型,并透露出本次升级的三点主要变化:

①混合推理架构:同时支持思考模式、非思考模式;

②更高的思考效率:DeepSeek-V3.1-Think能在更短时间内给出答案;

③更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

DeepSeek-V3.1采用了UE8M0 FP8 Scale 的参数精度,也就是使用8位浮点数精度,这可以实现算力效率提升。UE8M0是FP8张量数据的编码格式,Open Compute Project(OCP)开源硬件协作计划提出UE8M0,该计划由Facebook、英特尔等机构领衔

DeepSeek-V3.1之所以使用该参数精度,就是为了兼顾国产芯片的稳定性,这可以促进国产芯片的发展。

2、国产算力产业链快速崛起

DeepSeek-V3.2-Exp模型发布之后寒武纪华为国产算力巨头快速跟进同步完成适配工作

根据寒武纪开发者信息929寒武纪已经实现适配DeepSeek-V3.2-Exp模型并开源大模型推理引擎vLLM-MLU源代码寒武纪还表示公司一直重视芯片算法联合创新DeepSeek系列模型进行了深入的软硬件协同性能优化,达成了业界领先的算力利用率水平。

华为计算官方表示,快速实现了DeepSeek-V3.2-Exp BF16模型部署并且针对DSA结构叠加实现长序列亲和的CP并行策略,兼顾时延和吞吐。

2025年WAIC展示了384个昇腾神经网络处理单元与192个鲲鹏920中央处理器集成的昇腾384超节点真机,场面极为震撼,瞬间吸引了大量的观众。

早在今年5月,鲲鹏昇腾开发者大会2025便推出了昇腾超节点技术,可以实现业内最大规模的384卡高速总线互联,训练性能达到传统节点的三倍。

918日-20日,第十届华为全联接大会(HUAWEI CONNECT 2025)在上海隆重举行,华为副董事长兼轮值董事长徐直军表示,未来三年华为将要推出多款昇腾芯片

按照华为的研发时间表,昇腾950PR将在2026年一季度推出,该芯片将采用华为自研的HBM自研芯片。众所周知,算力芯片对存储芯片要求极高,以往HBM芯片只有三星、SK海力士等极少数厂商可以生产,这同时也制约了算力终端产品的供给。华为在HBM芯片取得突破,未来将极大促进国产算力芯片的发展。

2026年四季度至2028年四季度,华为将先后推出昇腾950DT、昇腾960芯片和昇腾970芯片,这将带来算力的快速跃升。

昇腾950PR/DT微架构将升级为SIMD/SIMT,算力将达到1PFLOPS(FP8)和2PFLOPS(FP4),互联带宽达到2TB/s。在FP8数据格式下,昇腾960、970芯片的算力将达到2PFLOPS(FP8)和4PFLOPS。

国产算力产业链携手发展背景下我国算力产业链规模快速增长截至今年上半年,我国在用算力中心标准机架达1085万架,智能算力规模达788 EFLOPS,干线400G端口数量大幅增加至14060个,存力总规模超过1680 EB,全国算力中心平均电能利用效率(PUE)降至1.42,算力基础设施规模和水平不断提升。

根据iFinD金融数据终端,中证算力指数成分股包括:中国移动工业富联中国电信海光信息寒武纪、中际旭创新易盛中兴通讯中科曙光中国联通澜起科技天孚通信等。

(本文首发于2025年930日)

李泉(投资顾问执业编号:S0930622070004;基金从业编号:A20211203001155)

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。