繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

夜讀 | 中國小公司竟成華爾街「黑天鵝」!引發美股恐慌的DeepSeek什麼來頭?

2025-01-27 23:47

1月27日,美國科技股盤前集體崩塌,主要科技公司市值總計蒸發超萬億美元。英偉達市值預計將下跌3000億美元,創下有史以來最大的單日跌幅。其他美國主要科技公司股價以及為數據中心提供能源支撐的歐洲能源公司股價也遭到重挫。

而引發這場資本市場「劇震」的是一家僅創立一年多,此前即便是在中國都名不見經傳的小型科技初創公司。這家名為DeepSeek的公司成爲了2025年攪動華爾街的首隻「黑天鵝」。

DeepSeek由量化基金幻方量化負責人梁文峰創立,該公司的AI模型R1自上周推出以來,被廣泛認為能與目前OpenAI和Meta的最新產品競爭,也被知名投資人馬克·安德森 (Marc Andreessen) 稱為「最令人驚歎和印象深刻的突破之一」,並將這一突破譽為「AI領域的斯普特尼克時刻」。

但也有機構向投資人發送報告稱,關於DeepSeek的「炒作」被誇大了,想用500萬美元顛覆OpenAI似乎「不太實際」。

截至發稿,DeepSeek服務狀態頁面顯示,20點55分,DeepSeek對話服務已恢復,賬號服務仍存在問題,用户或無法登錄及註冊。21點05分,DeepSeek更新稱,將繼續監測故障。此前,DeepSeek服務出現「宕機」。

改變遊戲規則的人是誰?

目前,DeepSeek應用程序位居蘋果公司應用商店排行榜首位,並採取開源模式。根據市場追蹤機構App Figures的數據,截至1月25日,DeepSeek應用程序的下載量已達160萬次。

1月27日A股市場,DeepSeek股東每日互動(300766.SZ)股價漲停。第一財經記者瞭解到,梁文峰曾在每日互動董事長方毅麾下,據公司文件,每日互動已將DeepSeek模型納入營銷。

生於1985年的梁文峰今年剛滿40歲,他上周也成為被選中參加總理和企業家會議的人工智能企業代表。他早在量化交易基金時就開始為人工智能項目購買數千個英偉達GPU。

不過,據早期與梁文峰接觸的商業夥伴透露,梁文峰有點「書呆子」,並「留着一頭糟糕的發型」。當梁文峰大談他要建立一個萬卡芯片集羣訓練大模型的想法時,「誰都沒有太把他當回事」。

梁文峰曾對他的夥伴説道:「我想建立萬卡集羣訓練大模型,這將改變遊戲規則。」但很多人都認為只有字節跳動或者阿里巴巴這樣的巨頭公司,纔有可能在中國實現這一目標。

此前,梁文峰在量化基金時,已經利用人工智能和算法來識別可能影響股價的模式,並積累了鉅額財富。他的團隊擅長使用英偉達的芯片通過股票交易賺錢。

2023年,梁文峰註冊1000萬元人民幣創立DeepSeek,宣佈他計劃開發人類級別的人工智能。為此,他把量化基金中最優秀的人才帶到了DeepSeek,建立了一支出色的人工智能基礎設施專業團隊,他們真正瞭解芯片的工作原理,並能早於其他中國本土科技公司,率先尋找到創新的方法來最大限度地發揮有限數量芯片的計算能力。

高薪聘請專業技術人才

值得關注的是,DeepSeek目前仍然是一家純技術公司,類似於谷歌旗下早期的DeepMind。它將模型開源,尚未進行貨幣化,也未向外部基金籌資。他認為,更多的投資不一定會帶來更多的創新,否則大公司將會「接管所有的創新」。

得益於梁文峰此前在量化基金賺得的鉅額財富,他有資本高薪聘請最優秀的人工智能人才。有網絡招聘信息顯示,DeepSeek招募的深度學習研究員月薪最高可達11萬元人民幣,核心系統研發工程師月薪也能高達9萬元,年薪輕松超過百萬。目前該公司在北京和杭州兩地設有團隊。

公開信息顯示,DeepSeek員工人數不到140人,這與海外同行OpenAI等超千人的研發團隊相比,規模僅約10%。

而且,與很多科技公司偏向於挖美國科技巨頭的人才不同,DeepSeek打造的人才隊伍是完全本土化的,這是該公司的另一個獨特之處。DeepSeek員工都來自中國頂尖學校,例如北大、清華和北航的博士,而不是來自美國機構的專家或者「海歸人才」。梁文峰的理念是必須自己培養頂尖人才,他本人獲得了浙江大學電子信息工程本科和碩士學位。

或許也只有中國本土人才在「省錢」這方面能做到極致,他們懂得如何充分利用計算資源來更便宜地訓練和運行模型。DeepSeek聲稱,它僅使用了2048個英偉達的H800芯片和560萬美元,就訓練了一個具有6710億個參數的模型。相比之下,OpenAI和谷歌訓練同等規模的AI模型所花費的費用要高出約十倍。

這意味着,大模型訓練的護城河可能被打破,並改變整個人工智能行業未來的格局。「擁有600萬美元資金的企業數量遠多於擁有1億美元或10億美元資金的公司。」一位人工智能領域資深投資人表示。

美國加州大學伯克利分校人工智能政策研究員Ritwik Gupta表示:「第一個訓練模型的人必須投入大量資源才能實現這一目標,但第二個人能以更便宜、更快的方式來實現這一目標。」 他還表示,中國的軟件系統工程師人才庫比美國大得多。

「DeepSeek效應」被誇大了嗎?

但也有華爾街分析師和人工智能研究人員並不認同這一觀點。「中國公司希望以500萬美元來複制OpenAI的路徑似乎不切實際,我們認為這真的不值得進一步討論。」Bernstein分析師在給客户的一份報告中寫道。另有一些研究人員認為,DeepSeek雖然能夠在訓練成本方面具有優勢,但這僅僅表明它能夠非常迅速地複製美國AI技術的最新發展,但長期來看難以保持領先。

DeepSeek崛起的背景正值美國對高性能AI芯片進行新一輪的限制。梁文峰此前在接受採訪時坦言,制約中國人工智能進一步發展的瓶頸,不是無法獲得更多的融資,而是對獲取美國最佳芯片的限制。這也是他為何強調中國需要發展自己的國內生態系統,而開源對於軟件生態至關重要。

一位科技行業分析師對第一財經記者表示:「開源意味着能將更多的用户集中起來,從而與全球各地的頂尖人才合作。而現在的情況表明,最好的開源技術來自於中國,美國的研發人員也能在中國的開源系統上構建產品。」

與DeepSeek的低成本形成對比的是,美國正在對人工智能基礎設施進行大量注資。上周,美國特朗普政府宣佈了一個「星際之門」AI投資項目,將投資1000億美元啟動該項目,並在未來四年內投資高達5000億美元。

另據瑞銀 (UBS)數據顯示,2024年,美國大型科技公司在人工智能方面的投資達到2240億美元,預計到2025年將達到2800億美元。

而在一些芯片分析師看來,周一美國科技股的暴跌只是短期的「過激反應」,因為DeepSeek的進步最終將對英偉達等人工智能芯片製造商產生積極影響。

芯片諮詢公司SemiAnalysis首席分析師Dylan Patel在一份報告中表示,從長遠來看,降低訓練和運行人工智能模型的成本將使企業和消費者更容易、更便宜地採用人工智能應用。「訓練和推理效率的進步使人工智能進一步擴大和普及。」Patel稱,「這種現象在半導體行業已經出現了幾十年,摩爾定律每兩年推動成本減半。

 

 

 

 

 

 

 

 

 

 

 

 

 

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。