简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

DeepSeek何以震撼全球AI界

2025-02-15 02:35

转自:团结报

  □许晨星

  1月20日,国内的AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1,短短两日便震动全球AI界。在之后的两周里,AI界“满城尽带DeepSeek”,英伟达、华为云、天翼云、亚马逊、微软Azure、阿里云、百度智能云、腾讯云、京东云等纷纷宣布接入DeepSeek-R1。

  那么,DeepSeek带来的震撼到底是什么?它后续的影响有哪些?

  如果你问DeepSeek“普通人怎样用DeepSeek挣钱”,它可能会给出很多看起来颇具实操性的手段,比如用DeepSeek生成广告文案、短视频脚本、电商产品描述,甚至还可以用它来写法律文书和辅助投资,而“用DeepSeek算命”也是近日热议的话题。

  从技术创新角度来看,DeepSeek以Transformer架构为基础,采用了混合专家模型(MoE)和多令牌预测(MTP)等技术,将算力效率提升30%以上。其推出的一系列模型如DeepSeek-V3仅用2048块GPU训练2个月,花费557.6万美元,就达到接近GPT-4的性能,且生成吐字速度相比前代实现3倍提升。在数学竞赛等任务中,DeepSeek-V3大幅超过其他开源闭源模型。这些成果充分展示了其技术的先进性和创新性,打破了人们对AI研发必须依赖大量资源投入的固有认知。

  在行业竞争与格局方面,DeepSeek打破了美国对AI的话语权垄断。其开源和低成本的特点,让全球开发者能够入局,促进了全球人工智能技术的共享与发展。亚马逊、微软等海外科技巨头也陆续宣布接入DeepSeek模型,这表明它在技术层面的卓越表现得到广泛认可。它的出现还倒逼微软、英伟达等巨头调整战略,加速全球AI生态从“闭源垄断”向“开源共生”转型。

  从社会影响来看,DeepSeek将AI从“巨头的玩具”变为“大众的工具”。其开源模型为开发者提供了一个低成本、高效能的人工智能开发平台,有助于缩小全球“智能鸿沟”,让更多人能够受益于人工智能技术。它还激发了全球范围内对人工智能创新的思考,为人才培养和创新生态建设提供了新的思路和方向。

  当然,DeepSeek也面临着一些挑战。比如近期因服务器资源紧张暂停了API服务充值,暴露出在应对快速增长的用户需求和市场热潮时,其在基础设施建设和资源管理方面存在一定的不足。

  随着人工智能市场竞争的加剧,DeepSeek需要不断创新和优化,以保持其技术领先地位和市场竞争力。

  总体而言,DeepSeek是一项具有巨大潜力的技术。但无论是将其用于看似玄幻的算命,还是充满利益诱惑的挣钱,都需要我们保持理性和清醒,要认清其本质是一个工具,应对它进行合理利用,为我们的生活和工作增添价值,而不是被其带来的热潮冲昏头脑,陷入不必要的风险之中。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。