熱門資訊> 正文
2025-11-01 13:02
外國開發者:我們該開始學習中文了嗎?
繃不住了,美國科技公司最新發布的大模型,思考時怎麼一直在説中文?
本周,知名 AI 代碼工具 Cursor 發佈了 2.0 版重大更新,推出了首個自家的代碼模型 Composer,以及用於並行協作多個智能體的新界面。
新模型一發布,大家在祝賀 Cursor 終於「揚眉吐氣」、用上自家模型的同時,也發現這個大模型在思考的時候一直講中文,而且行為和國產模型極其相似。
Composer 是 Cursor 使用強化學習訓練的一個大型 MoE 模型,能夠出色地處理實際代碼,並且速度非常快。
內部基準測試中該模型在編碼任務上達到行業前沿水準,生成速度比同類模型快四倍。
據官方博客介紹,在研發過程中,他們試驗了一個代號為 Cheetah 的原型智能體模型,以更好地理解更高速智能體模型的影響。Composer 是該模型的更智能升級版,憑藉足夠的速度支撐交互式體驗,讓編碼始終絲滑。
不過在看到模型輸出了這麼多中文之后,人們紛紛開始猜測它背后的「基礎」是哪家大模型,難道是 Qwen Code?
無獨有偶。
AI 編程獨角獸 Cognition 近期也推出了他們最新 AI 模型 SWE-1.5。這是一款快速智能體模型,參數量達到了數千億,在編碼性能上接近 SOTA,並顯著提升了速度 —— 比 Haiku 4.5 快 6 倍,比 Sonnet 4.5 快 13 倍。
目前該模型已在他們的 IDE 平臺 Windsurf 上開放使用。
不過,模型發佈出來之后很快就被人們仔細分析了一通,有網友認為 Cognition 的新模型背后也是基於中國的 AI 模型進行開發和改進的。
有人對 SWE 1.5 進行了大模型「越獄」,結果模型直接回答自己是智譜 AI 開發的 GLM 大模型。
智譜的官推也來轉推祝賀。
業界大佬:證據指向中國開源模型
X 博主 @deedydas 認為,Cognition 的 SWE-1.5 是基於中國公司智譜的 GLM 4.6 模型進行定製(精調 / 強化學習),並運行在 Cerebras 的硬件上;Cursor 的 Composer 模型也帶有中國式推理痕跡。
最新消息,cerebras 發郵件官宣,11 月 5 日推出 zai-glm-4.6 作為新編碼模型,這是給實錘了?
系統架構師 Daniel Jeffries 也發帖表示,有很多證據表明 WindSurf 和 Cursor 這些新模型都是經過微調,而不是從零開始訓練的,這對於開源社區來説是一個勝利。
Jeffries 進一步指出,從頭開始訓練一個基礎模型的成本極其高昂,許多資金和計算資源更雄厚的公司都未能成功。因此,WindSurf 和 Cursor 團隊選擇在后期訓練階段投資強化學習是非常合邏輯的,尤其是他們已經擁有強大的數據集和大量用户編碼數據,這些數據更容易進行處理。
他還認為,Cursor 和 WindSurf 的團隊並沒有足夠的資金來建設一個龐大的訓練集羣,也沒有足夠的數據和團隊支持從零開始建立一個大模型。在當前,許多大型實驗室已經在這一領域建立了強大的規模,單靠獨立開發是無法成功的。
此外,他還指出,一些反對開源的公司和個人阻礙了開源模型的發展,影響了現代軟件開發和創新的進程。他呼籲美國公司意識到開源的重要性,迴歸開源理念,而不是發佈功能受限的專有模型。
目前,Jeffries 發佈的這篇帖子已被 LeCun 轉發,進一步引發了討論。
網友們紛紛表示,中國的開源基礎模型已經具備了足夠的能力來支持西方產品的開發,這意味着全球 AI 正進入多極化競爭的新格局。
有網友幽默評論道:是不是該開始學中文了?
國產開源模型,已成為 AI 領域主流
10 月 29 日,英偉達 CEO 黃仁勛在華盛頓的 GTC 大會上,除了發佈新 GPU,也說了一番對目前 AI 行業現狀的觀察。他表示開源模型已變得非常強大,大大加速了 AI 應用的進程,開發者、研究者、全球的公司都需要開源。
在老黃展示的全球開源模型的下載及採用情況圖中可以看到,2025 年以來,阿里的通義千問模型(Qwen)已佔據開源模型的大部分市場份額,並且領先優勢還在持續擴大中,衍生模型數量也是全球第一。
隨着開源模型的推理能力、多模態能力、專業領域能力的提升,它們不僅僅在幫助開發者,甚至已成為初創公司的命脈。或許對於 Cursor 和 Cognition 來説就是這樣。
除此之外,在 AI 社區 HuggingFace 的趨勢榜上,排行前列的模型都出自國內公司,有 MiniMax、DeepSeek、Kimi、百度、混元、千問,還有美團的 LongCat。
在第三方的基準平臺 ArtificialAnalysis 上比較和分析模型質量、性能、推理速度、上下文窗口、參數數量和許可詳情等性能指標,排行前列的也大多數是國產模型。
看起來不論是在模型技術水平與能力,還是全球開發者、科技公司的接受度上,國內開源大模型都已經確立了領先的地位,正在改變着全球 AI 領域的競爭格局。
這場大模型技術競賽中,追趕者和領先者的身位,正在慢慢發生變化。
本文來自微信公眾號 「機器之心」(ID:almosthuman2014),作者:澤南、楊文,36氪經授權發佈。