最新外國「自研」大模型，都是套殼國產？

2025-11-01 13:02

外國開發者：我們該開始學習中文了嗎？

繃不住了，美國科技公司最新發布的大模型，思考時怎麼一直在説中文？

本周，知名 AI 代碼工具 Cursor 發佈了 2.0 版重大更新，推出了首個自家的代碼模型 Composer，以及用於並行協作多個智能體的新界面。

新模型一發布，大家在祝賀 Cursor 終於「揚眉吐氣」、用上自家模型的同時，也發現這個大模型在思考的時候一直講中文，而且行為和國產模型極其相似。

Composer 是 Cursor 使用強化學習訓練的一個大型 MoE 模型，能夠出色地處理實際代碼，並且速度非常快。

內部基準測試中該模型在編碼任務上達到行業前沿水準，生成速度比同類模型快四倍。

據官方博客介紹，在研發過程中，他們試驗了一個代號為 Cheetah 的原型智能體模型，以更好地理解更高速智能體模型的影響。Composer 是該模型的更智能升級版，憑藉足夠的速度支撐交互式體驗，讓編碼始終絲滑。

不過在看到模型輸出了這麼多中文之后，人們紛紛開始猜測它背后的「基礎」是哪家大模型，難道是 Qwen Code？

無獨有偶。

AI 編程獨角獸 Cognition 近期也推出了他們最新 AI 模型 SWE-1.5。這是一款快速智能體模型，參數量達到了數千億，在編碼性能上接近 SOTA，並顯著提升了速度 —— 比 Haiku 4.5 快 6 倍，比 Sonnet 4.5 快 13 倍。

目前該模型已在他們的 IDE 平臺 Windsurf 上開放使用。

不過，模型發佈出來之后很快就被人們仔細分析了一通，有網友認為 Cognition 的新模型背后也是基於中國的 AI 模型進行開發和改進的。

有人對 SWE 1.5 進行了大模型「越獄」，結果模型直接回答自己是智譜 AI 開發的 GLM 大模型。

智譜的官推也來轉推祝賀。

業界大佬：證據指向中國開源模型

X 博主 @deedydas 認為，Cognition 的 SWE-1.5 是基於中國公司智譜的 GLM 4.6 模型進行定製（精調 / 強化學習），並運行在 Cerebras 的硬件上；Cursor 的 Composer 模型也帶有中國式推理痕跡。

最新消息，cerebras 發郵件官宣，11 月 5 日推出 zai-glm-4.6 作為新編碼模型，這是給實錘了？

系統架構師 Daniel Jeffries 也發帖表示，有很多證據表明 WindSurf 和 Cursor 這些新模型都是經過微調，而不是從零開始訓練的，這對於開源社區來説是一個勝利。

Jeffries 進一步指出，從頭開始訓練一個基礎模型的成本極其高昂，許多資金和計算資源更雄厚的公司都未能成功。因此，WindSurf 和 Cursor 團隊選擇在后期訓練階段投資強化學習是非常合邏輯的，尤其是他們已經擁有強大的數據集和大量用户編碼數據，這些數據更容易進行處理。

他還認為，Cursor 和 WindSurf 的團隊並沒有足夠的資金來建設一個龐大的訓練集羣，也沒有足夠的數據和團隊支持從零開始建立一個大模型。在當前，許多大型實驗室已經在這一領域建立了強大的規模，單靠獨立開發是無法成功的。

此外，他還指出，一些反對開源的公司和個人阻礙了開源模型的發展，影響了現代軟件開發和創新的進程。他呼籲美國公司意識到開源的重要性，迴歸開源理念，而不是發佈功能受限的專有模型。

目前，Jeffries 發佈的這篇帖子已被 LeCun 轉發，進一步引發了討論。

網友們紛紛表示，中國的開源基礎模型已經具備了足夠的能力來支持西方產品的開發，這意味着全球 AI 正進入多極化競爭的新格局。

有網友幽默評論道：是不是該開始學中文了？

國產開源模型，已成為 AI 領域主流

10 月 29 日，英偉達 CEO 黃仁勛在華盛頓的 GTC 大會上，除了發佈新 GPU，也說了一番對目前 AI 行業現狀的觀察。他表示開源模型已變得非常強大，大大加速了 AI 應用的進程，開發者、研究者、全球的公司都需要開源。

在老黃展示的全球開源模型的下載及採用情況圖中可以看到，2025 年以來，阿里的通義千問模型（Qwen）已佔據開源模型的大部分市場份額，並且領先優勢還在持續擴大中，衍生模型數量也是全球第一。

隨着開源模型的推理能力、多模態能力、專業領域能力的提升，它們不僅僅在幫助開發者，甚至已成為初創公司的命脈。或許對於 Cursor 和 Cognition 來説就是這樣。

除此之外，在 AI 社區 HuggingFace 的趨勢榜上，排行前列的模型都出自國內公司，有 MiniMax、DeepSeek、Kimi、百度、混元、千問，還有美團的 LongCat。

在第三方的基準平臺 ArtificialAnalysis 上比較和分析模型質量、性能、推理速度、上下文窗口、參數數量和許可詳情等性能指標，排行前列的也大多數是國產模型。

看起來不論是在模型技術水平與能力，還是全球開發者、科技公司的接受度上，國內開源大模型都已經確立了領先的地位，正在改變着全球 AI 領域的競爭格局。

這場大模型技術競賽中，追趕者和領先者的身位，正在慢慢發生變化。

本文來自微信公眾號「機器之心」（ID：almosthuman2014），作者：澤南、楊文，36氪經授權發佈。