热门资讯> 正文
2025-02-07 08:11
登录新浪财经APP 搜索【信披】查看更多考评等级
(来源:山西证券研究所)
【事件描述】
1月20日,DeepSeek R1模型正式发布,在数学、代码、自然语言推理等任务上的性能比肩OpenAI o1正式版,目前已在网页端、APP端和API全面上线。DeepSeek在开源DeepSeek R1 Zero和DeepSeek R1两个660B模型的同时,蒸馏并开源了6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1 mini的效果。
【事件点评】
DeepSeek R1和V3模型在强化学习、MoE架构、MTP、PTX编程等多个维度进行全方位优化,整体性能对齐国际顶尖大模型。DeepSeek模型优异的性能主要得益于其团队在多个维度进行系统性优化,其中,1)强化学习:DeepSeek R1模型直接从V3基础模型实施强化学习训练,成为首个无监督微调的强化学习训练模型,在激发模型自我学习能力的同时降低数据标注的成本;2)MoE:相比于GShard等传统MoE架构,DeepSeek MoE专家粒度更细,其拥有256个路由专家和1个共享专家,能够大幅提升模型性能;3)MTP:即多token预测,通过提前预测部分输出token,DeepSeek模型效率得到显著提升;4)PTX编程:DeepSeek开创性地采用类似汇编语言的英伟达并行线程执行(PTX)编程,而非完全依赖CUDA,PTX作为一种非常接近底层硬件的指令集架构,使DeepSeek团队能够实现更细粒度的优化操作。此外,DeepSeek还支持FP8精度训练、使用多头潜在注意力机制等实现高效训练和推理。
对应用的影响:模型性能提升叠加调用成本下降,AI应用发展有望加速。凭借架构创新和工程优化,DeepSeek用更少的数据和更低的成本就研发出性能比肩OpenAI o1的模型,目前包括国内的百度、腾讯及海外的微软、亚马逊等在内的大型CSP均已接入DeepSeek模型,通过其云平台向AI应用开发者及用户输出模型能力。同时,DeepSeek R1的使用成本大幅低于o1模型,DeepSeek R1 API的服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中)、每百万输出tokens 16元,而o1的输入价格为每百万tokens 55元(缓存命中)/110元(缓存未命中),输出价格为每百万tokens 438元。基于DeepSeek等低成本的高性能模型,上层AI应用的开发及落地有望加速,根据AI产品榜数据,DeepSeek APP上线20天日活突破2000万,已成为全球增速最快的AI应用,同时,部分初创公司已开始从OpenAI模型向DeepSeek切换,其中,企业级AI代理开发商SuperFocus将从GPT-4o等模型转向DeepSeek。
对算力的影响:推理算力需求有望爆发,国产芯片厂商将充分受益。在训练端,虽然DeepSeek V3论文中公布的557.6万美元训练成本仅考虑了正式训练阶段,不包括与此前架构、算法和数据研究及消融实验相关的成本,但我们认为,基于DeepSeek的算法创新和工程优化效果显著,其总训练成本仍将显著低于其他主流模型,而这将推动中小型大模型厂商沿着DeepSeek的路径再次大力投入模型研发,从而助推训练算力需求持续增长;在推理端,DeepSeek有望促进AI应用发展提速,进而显著刺激推理算力需求。由于AI推理对单个集群的算力要求远低于训练,而更关注推理效率和性价比,ASIC以及国产芯片有望逐步抢占英伟达GPU的份额,目前华为昇腾、海光信息、寒武纪、昆仑芯等国产AI芯片第一梯队厂商正加速追赶英伟达,其中,昇腾910B已基本可对标A100,成为国内互联网厂商国产训练芯片的首选,而寒武纪、海光信息、昆仑芯新一代主力产品思元590、深算三号、昆仑芯3代未来有望对H20形成替代。
【投资建议】
DeepSeek在保持高性能的同时降低使用成本,将加速AI应用发展,进而推动推理算力需求快速增长,同时,基于DeepSeek蒸馏的小模型将加快模型在端侧场景的落地,因此重点关注1)各领域的头部AI应用厂商,包括金山办公、汉得信息、彩讯股份、万兴科技、三六零、新致软件、泛微网络、能科科技、润达医疗等;2)国产算力芯片厂商,包括海光信息、寒武纪等;3)AI服务器厂商,包括四川长虹、神州数码、拓维信息、浪潮信息、中科曙光、华勤技术等;4)算力云厂商,包括青云科技、优刻得等;5)端侧硬件厂商,包括美格智能、移远通信、广和通、乐鑫科技、中科蓝讯、恒玄科技等。
【风险提示】
AI产品落地不及预期,行业竞争加剧风险,技术研发进展不及预期。
分析师:方闻千
执业登记编码:S0760524050001
报告发布日期:2025年2月6日
【分析师承诺】
本人已在中国证券业协会登记为证券分析师,本人承诺,以勤勉的职业态度,独立、客观地出具本报告。本人对证券研究报告的内容和观点负责,保证信息来源合法合规,研究方法专业审慎,分析结论具有合理依据。本报告清晰准确地反映本人的研究观点。本人不曾因,不因,也将不会因本报告中的具体推荐意见或观点直接或间接受到任何形式的补偿。本人承诺不利用自己的身份、地位或执业过程中所掌握的信息为自己或他人谋取私利。
【免责声明】
本订阅号不是山西证券研究所证券研究报告的发布平台,所载内容均来自于山西证券研究所已正式发布的证券研究报告,订阅者若使用本订阅号所载资料,有可能会因缺乏对完整报告的了解而对其中关键假设、评级、目标价等内容产生理解上的歧义。提请订阅者参阅山西证券研究所已发布的完整证券研究报告,仔细阅读其所附各项声明、信息披露事项及风险提示,关注相关的分析、预测能够成立的关键假设条件,关注投资评级和证券目标价格的预测时间周期,并准确理解投资评级的含义。
依据《发布证券研究报告执业规范》规定特此声明,禁止我司员工将我司证券研究报告私自提供给未经我司授权的任何公众媒体或者其他机构;禁止任何公众媒体或者其他机构未经授权私自刊载或者转发我司的证券研究报告。刊载或者转发我司证券研究报告的授权必须通过签署协议约定,且明确由被授权机构承担相关刊载或者转发责任。