繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

港股概念追蹤丨DeepSeek訓練成本不到GPT的二十分之一 !AI應用或迎來低成本擴張

2025-01-27 10:12

AI公司DeepSeek刷屏美國各大主流媒體和社交網站。有人猜測,可能是因為:1月20日DeepSeek發佈了可以媲美OpenAI O1的R1模型。

天眼查顯示,DeepSeek的開發者為杭州深度求索人工智能基礎技術研究有限公司,該公司成立於2023年7月份,由寧波程恩企業管理諮詢合夥企業和梁文鋒共同持股。 

據瞭解,深度求索背后的操盤手梁文鋒是金融圈成名已久的高手。他創立的幻方量化,為國內量化私募巨頭之一。 

值得注意的是,據湛江發佈消息,性能比肩GPT-4o的DeepSeek-V3,投入研發費用為558萬美元,訓練成本不到GPT-4o的1/20,且只用了2048張H100的GPU集羣,用時僅53天。在同等水平下,哪怕是全球AI第一梯隊的頭部公司,至少也要用到1.6萬張以上的GPU進行訓練。

智通財經APP獲悉,DeepSeek大模型以極低成本(600萬美元)和少量芯片(2000塊)實現了與OpenAI等巨頭相媲美的性能,挑戰了"唯有科技巨頭才能研發尖端AI"的行業共識。

其成功源於中國工程師在美國芯片限制下的創新突破:通過開源生態協作、算法優化及資源整合,將黑市芯片與量化交易公司的算力積累轉化為技術優勢。

這種模式不僅揭示美國技術封鎖的意外反效果,更預示中國可能通過開源主導權重構全球AI競爭格局,使低成本創新成為顛覆行業的新路徑。

市場理解,低成本可獲得最佳模型效果,對前期算力堆砌大模型邏輯否定。同時,也對中小型AI創新企業構成實質利好。

中信證券發佈研報稱,近日,DeepSeek-V3的正式發版引起AI業內廣泛高度關注,其在保證了模型能力的前提下,訓練效率和推理速度大幅提升。

中信證券認為,DeepSeek新一代模型的發佈意味着AI大模型的應用將逐步走向普惠,助力AI應用廣泛落地;同時訓練效率大幅提升,亦將助力推理算力需求高增。

伴隨模型能力升級,Agent等應用形式有望加速落地,帶動辦公、教育、管理、端側、具身智能等應用領域公司加速兑現業績彈性。中信證券持續看好AI產業鏈的加速落地機遇。

AI應用相關港股企業:

醫渡科技(02185)、創新奇智(02121)、匯量科技(01860)、第四範式(06682)、粉筆(02469)、晶泰控股-P(02228)等。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。