简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

港股概念追踪丨DeepSeek训练成本不到GPT的二十分之一 !AI应用或迎来低成本扩张

2025-01-27 10:12

AI公司DeepSeek刷屏美国各大主流媒体和社交网站。有人猜测,可能是因为:1月20日DeepSeek发布了可以媲美OpenAI O1的R1模型。

天眼查显示,DeepSeek的开发者为杭州深度求索人工智能基础技术研究有限公司,该公司成立于2023年7月份,由宁波程恩企业管理咨询合伙企业和梁文锋共同持股。 

据了解,深度求索背后的操盘手梁文锋是金融圈成名已久的高手。他创立的幻方量化,为国内量化私募巨头之一。 

值得注意的是,据湛江发布消息,性能比肩GPT-4o的DeepSeek-V3,投入研发费用为558万美元,训练成本不到GPT-4o的1/20,且只用了2048张H100的GPU集群,用时仅53天。在同等水平下,哪怕是全球AI第一梯队的头部公司,至少也要用到1.6万张以上的GPU进行训练。

智通财经APP获悉,DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了"唯有科技巨头才能研发尖端AI"的行业共识。

其成功源于中国工程师在美国芯片限制下的创新突破:通过开源生态协作、算法优化及资源整合,将黑市芯片与量化交易公司的算力积累转化为技术优势。

这种模式不仅揭示美国技术封锁的意外反效果,更预示中国可能通过开源主导权重构全球AI竞争格局,使低成本创新成为颠覆行业的新路径。

市场理解,低成本可获得最佳模型效果,对前期算力堆砌大模型逻辑否定。同时,也对中小型AI创新企业构成实质利好。

中信证券发布研报称,近日,DeepSeek-V3的正式发版引起AI业内广泛高度关注,其在保证了模型能力的前提下,训练效率和推理速度大幅提升。

中信证券认为,DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。

伴随模型能力升级,Agent等应用形式有望加速落地,带动办公、教育、管理、端侧、具身智能等应用领域公司加速兑现业绩弹性。中信证券持续看好AI产业链的加速落地机遇。

AI应用相关港股企业:

医渡科技(02185)、创新奇智(02121)、汇量科技(01860)、第四范式(06682)、粉笔(02469)、晶泰控股-P(02228)等。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。