简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效,API同步降价-251012

2025-10-12 19:16

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:研报虎)

主要观点:

  9月29日DeepSeek-V3.2-Exp正式发布,DSA实现训练推理提效

  DeepSeek-V3.2-Exp模型是一个实验性版本,在V3.1-Terminus的基础上引入了DeepSeek Spare Attention(稀疏注意力机制),针对长文本训练和推理效率进行探索性优化和验证。

  技术层面:1)DeepSeek Spare Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。根据各领域性能公开评测集结果(通用、搜索、代码、代码智能体、数学),DeepSeek-V3.2-Exp表现与V3.1-Terminus基本持平;2)开源TileLang与CUDA两种算子,TileLang由北大团队研发,专为简化高难度GPU算子开发而设计,将成为替代主流OpenAI领域特定语言Triton的有力备选,TileLang将调度空间与数据流解耦,使开发者能够直观地控制数据在硬件中的流动,根据TileLang在GitHub的说明文档,不仅支持英伟达CUDA,还已扩展支持华为昇腾等国产芯片。DeepSeek使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。

API价格下调,开发者API调用成本将降低50%以上

  受益于新模型服务成本大幅降低,API调用价格相应下调。目前DeepSeek-V3.2-Exp API价格为输入0.2元/百万tokens(缓存命中),2元/百万tokens(缓存未命中),输出3元/百万tokens。

  新价格政策下开发者调用DeepSeek API的成本将降低50%以上。我们认为,DeepSeek-V3.2-Exp在技术层面探索了新的稀疏注意力机制,推动中国算力生态协同创新与演进,进一步将模型与算法层面的创新,与中间层的编译语言与更底层的计算芯片协同起来,推动中国算力生态的成长。模型发布后华为昇腾和寒武纪均第一时间宣布完成适配工作,表明国产AI算力生态已进入模型与芯片协同设计阶段。相关公司:神州数码、寒武纪、品高股份北京利尔安博通优刻得浪潮信息紫光股份超讯通信(维权)首都在线

风险提示

  1)下游预算限制信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响科技产业发展。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。