熱門資訊> 正文
2025-01-30 15:05
(來源:投資界)
杭州另一面。
作者 I 吳瓊
報道 I 投資界PEdaily
大年初一,廣東湛江吳川米歷嶺村,迎來一波又一波打卡人羣。
這是爆紅全球DeepSeek的創始人梁文鋒老家。早年間成長於廣東,后來考入浙江大學。碩士畢業后,梁文鋒與幾位浙大同學開始創業之路。2023年,他帶領團隊成立DeepSeek,如今席捲全球科技圈。
DeepSeek被視為拉開中國科技爆炸的序幕,成為今年第一個現象級中國企業。甚至有投資人透露,「找他們的人踏破門檻了」。
當DeepSeek在海外大殺四方,央視春晚會上,一羣人形機器人登上舞臺扭秧歌,背后的宇樹科技正是中國具身智能標誌性獨角獸。追溯下來,他們都來自杭州。
湛江85后
締造新年最火獨角獸
梁文鋒,1985年出生於廣東湛江吳川,父母都是小學語文老師,這也使得他從小就成績優異。「湛江發佈」提及他一段成長往事:梁文鋒性格很文靜,但不是書呆子,在學習上很有自己的「一套方法」,初中時就學完了高中數學,甚至開始學大學數學。
2002年,梁文鋒以吳川一中「高考狀元」的成績考上浙江大學,本科就讀電子信息工程專業,之后又繼續攻讀浙江大學信息與通信工程專業研究生。大學期間,梁文鋒就與同學一起開始積累市場行情數據和探索全自動量化交易。
2015年,梁文鋒碩士畢業后和幾位浙大同學共同創立了量化對衝基金公司幻方量化,並於當年拿到第一張私募牌照,幾年時間管理規模迅速超百億。
有意思的是,2016年幻方量化便首次上線AI策略,並在之后實現投資策略全面AI化,同時也是國內唯一公開宣稱擁有萬張英偉達A100顯卡的企業。大學時期梁文鋒便堅信「AI一定會改變世界」,這些都為后來投身AI埋下伏筆。
轉折點是2023年,全球AI大模型風起雲涌,國內大佬紛紛宣佈AI創業,梁文鋒也是其中一員。那年4月,梁文鋒宣佈正式進軍通用人工智能領域,「追尋一直以來的技術理想,超越投資去直面更大的課題」。很快,DeepSeek在杭州應運而生——同年11月,DeepSeek 發佈了開源的代碼大模型。
成立至今,DeepSeek並未開放過外部融資,因此也並未引起創投圈的過多關注。直至2024年5月,DeepSeek發佈DeepSeek-V2開源MoE模型,因極度降低推理成本,意外掀起一場大模型「價格戰」,開始出圈。
隱祕低調,卻聚集了一羣AI天才。據悉,DeepSeek包括創始人梁文鋒在內,僅有130多名工程師和研究人員。不同於其他明星創業公司,DeepSeek鮮有海歸,團隊成員幾乎都來自清華大學、北京大學、中山大學、北京郵電大學等國內頂尖高校,不少還是在讀博士。去年底,雷軍開出千萬年薪挖角DeepSeek研究員羅福莉。
這一次,DeepSeek正式浮出水面。上個月,梁文鋒和團隊開發的大模型DeepSeek-V3正式發佈。起初在AI發燒友圈內流傳,由於表現出色,一時轟動硅谷。1月20日,DeepSeek正式發佈DeepSeek R1,開始席捲全球。
一夜掀翻美國科技股
高潮發生在春節前夕。
DeepSeek應用登頂蘋果中國地區和美國地區應用商店免費App下載排行榜,在美區下載榜上超越ChatGPT。這也是首次中國應用能同期在中國和美區蘋果App Store佔據第一位。
那麼,DeepSeek為何這麼火?
簡單來看,DeepSeek R1在數學、代碼、自然語言推理等任務上的性能,可以比肩OpenAI o1模型正式版。
而DeepSeek R1被討論的焦點,主要集中在低訓練與使用成本以及開源兩方面。區別於OpenAI「海量數據投喂」的方式,DeepSeek利用算法把數據進行總結分類,經過選擇性處理之后輸送給大模型,在提高訓練效率的同時,也降低了DeepSeek的成本。
據DeepSeek介紹,R1的預訓練費用只有557.6萬美元,在2048塊英偉達H800 GPU集羣上運行55天完成,僅是OpenAI GPT-4o模型訓練成本的不到十分之一。以極低成本挑戰了大廠們依賴鉅額資本投資的模式。
「這可能是個國運級別的科技成果」,《黑神話:悟空》製作人馮驥激動評價,「這樣震撼的突破,來自一個純粹的中國公司。」
值得一提的是,美國總統特朗普上任第二天曾宣佈,OpenAI、軟銀集團和甲骨文將合資成立一家名為「星際之門」(Stargate)的新公司,計劃未來四年在美國投資5000億美元,用於建設超大規模數據中心。
DeepSeek現象級崛起,無疑為「星際之門」潑了盆冷水。有分析指出,「如果DeepSeek能夠通過較小的數據中心生存下來,那麼大型科技公司可能在AI計劃的電力上花費過多。」
美國科技股被一夜「掀翻」。1月27日美股收盤,英偉達股價下跌近17%,市值單日蒸發近6000億美元,創下美國上市公司單日損失紀錄。此外,不少美股主要科技公司股價也出現不同程度下跌。
目之所及,掀起一場更為激烈的AI競賽。爲了應對壓力,OpenAI CEO奧特曼不僅發佈首個智能體Operator搶熱度,還對外劇透起即將上線的o3-mini。而DeepSeek在除夕當天再次祭出「重磅炸彈」——發佈開源多模態模型Janus-Pro,進軍文生圖領域。
面對突然爆火,DeepSeek反而冷靜許多,梁文鋒在除夕夜謙遜迴應,「我們不過是站在開源社區巨人們的肩膀上,給國產大模型這棟大廈多擰了幾顆螺絲。」他還分享了更多細節——「那個能在手機上跑的mini模型,靈感來自甘肅一位中學老師在GitHub提的issue;支持聯網搜索的功能,是內測用户連續三十天凌晨三點提交錯誤日誌喂出來的。」每一項突破背后,都凝結着更為動人的故事。
現在,DeepSeek還在招兵買馬,在招聘平臺上,DeepSeek正有超過50個崗位在招人,其中「深度學習研究員-AGI」一職月薪最高甚至達到11萬元,年薪百萬。正如梁文鋒所説,「中國 AI 不可能永遠處在跟隨的位置」,這一幕正在被一羣中國年輕人實現。
杭州,悄悄崛起「六小龍」
「這個春節,杭州贏麻了。」
DeepSeek總部位於杭州,此時同樣爆火的還有來自杭州的宇樹科技。2025年央視春晚舞臺上,宇樹科技旗下機器人H1驚艷亮相。十幾個人形機器人身穿東北特色花棉襖,手持紅手帕登上舞臺,與舞蹈演員們默契配合,上演了一場創意融合舞蹈《秧Bot》。
一級市場對宇樹科技並不陌生。2016年,浙江90后王興興在杭州成立宇樹科技,開始融資之路——其中記憶猶新的是2024年春節前夕,宇樹科技一舉完成了近10億元的B2輪融資,投資方包括美團、金石投資、源碼資本,及老股東深創投、中網投、容億、敦鴻和米達鈞石。
前不久,宇樹科技發佈了一段最新機器狗產品B2-W的演示視頻,視頻中B2-W機器狗展現了一系列高難度動作,翻山、涉水、跳高和負重載人都不在話下,還引來馬斯克轉發評論,火爆海外。
回首2024年,杭州還誕生了火爆全球的遊戲大作——《黑神話:悟空》。時間回到2018年,遊戲科學組建了一個專注於單機遊戲的團隊,負責開發一款名為《黑神話:悟空》的高品質單機遊戲,並在第二年將團隊搬到了杭州。
馮驥曾回憶,「就是喜歡這座城市的氛圍,杭州的人才環境非常適合做遊戲的藝術設計,因為這里有中國美院,而且整座城市的動漫氛圍和人才基礎非常好。」
不止於此。2018年,一個來自杭州的考察團在美國波士頓找到強腦科技創始團隊。雖然他們製作的模型還很粗糙,就連辦公地點都設在地下室,但憑藉對未來產業的前瞻佈局,杭州還是毫不猶豫將強腦科技招引落地,併爲公司提供了總部落户所需的研發和產業化空間。
如今,強腦科技與馬斯克的Neuralink成為全球唯二融資超過2億美元的腦機接口公司,並實現了全球首個便攜式高精度腦機接口產品10萬台量產。
還有浙大副教授朱秋國創辦的雲深處科技,旗下機器人「絕影X30」已在新加坡電力隧道進行巡檢,是中國機器人走進海外電力系統的「第一單」;以及因開發出市場佔有率高達70%的家居設計軟件「酷家樂」聞名於世的羣核科技。
而它們,被並稱為「杭州六小龍」,在海外爆紅,成為杭州科技產業的一張張名片。
星星之火,正令杭州科技形成燎原之勢。正如梁文鋒寫道,「或許在不遠的未來,當宇樹的機器人踩着雲深處的步態算法走來,搭載着強腦的神經接口,運行着DeepSeek的認知引擎,用羣核構建的虛擬世界作為訓練場——那個我們幻想中的具身智能,就會從西溪濕地的晨霧里跌跌撞撞地走向人間。」
在1月中旬召開的浙江兩會期間,杭州市委副書記、市長姚高員接受中央廣播電視總檯專訪時,專門迴應「杭州六小龍」在國際上出圈走紅的現象:
「不管叫‘幾小龍’,杭州將堅定不移推進創新活力之城建設,在2025年重點打造‘三個地’:具有全球影響力的創新策源地、全國科技成果轉移轉化的首選地、發展新質生產力的重要陣地。」他表示,「財力再緊張,也不能去壓減科技投入,讓創新始終成為杭州的城市氣質。」
眼下,中國科技創業者們正在技術洪流中重新定義這一古老文明。借用梁文鋒在除夕夜寫下的話,「DeepSeek願做大家代碼荒野里的火柴,但真正點燃AI火種的,永遠是你們眼底不滅的好奇與堅持」。