剛剛，Cursor 2.0攜自研模型Composer強勢登場，不再只做「殼」

2025-10-30 11:28

Cursor 2.0 終於來了！

剛剛，Cursor 發佈了兩項重大更新：首個編碼模型 Composer，以及用於並行協作多個智能體的新界面。

此舉意義非凡。一直以來，Cursor 雖然廣受歡迎，但終究免不了「AI 時代的 VS Code」的帽子，因為它此前只能使用 Claude、GPT 等第三方模型。這既是 Cursor 的起點，也成了它的瓶頸。

Composer 的發佈，堪稱是 Cursor 打破這個瓶頸的「獨立宣言」，這也標誌着 Cursor 正式從「AI 外殼」向「AI 原生平臺」進化。

自研模型 Composer

Composer 是一款前沿模型，雖然智能程度不敵 GPT-5 等最佳前沿模型，但速度確實遙遙領先，達到了同等智能模型的 4 倍。

在基準測試中，Composer 實現了前沿水平的編碼智能，同時生成速度達到每秒 250 個 token—— 大約是領先的快速推理模型的兩倍，是同類前沿系統的四倍。（注：Cursor 發佈的對比將模型分為幾個類別：「最佳開源」（例如，Qwen Coder、GLM 4.6）、「快速前沿」（Haiku 4.5、Gemini Flash 2.5）、「2025 年 7 月前沿」（年中可用的最強模型）以及「最佳前沿」（包括 GPT-5 和 Claude Sonnet 4.5）。Composer 在匹敵中端前沿系統智能水平的同時，還在所有測試類別中實現了有記錄以來的最高生成速度。）

該模型專為在 Cursor 中進行低延迟的智能體式編碼而打造，大多數回合在 30 秒內完成。早期測試者認為其快速迭代的能力非常順手，並願意信任它處理多步驟編碼任務。

官方表示，Composer 通過一組強大的工具進行訓練，包括覆蓋整個代碼庫的語義搜索，因此在理解與處理大型代碼庫方面顯著更強。

具體來説，在訓練過程中，Composer 可使用一套生產級的搜索與編輯工具，並被要求高效解決各類棘手問題。

該模型的研發動力源於 Cursor 團隊在開發 Cursor Tab（自研的補全模型）時的經驗。

他們發現，開發者往往希望使用既足夠智能又能支持交互式使用的模型，以保持編碼的專注與流暢。在研發過程中，他們試驗了一個代號為 Cheetah 的原型智能體模型，以更好地理解更高速智能體模型的影響。Composer 是該模型的更智能升級版，憑藉足夠的速度支撐交互式體驗，讓編碼始終愉快順滑。

從架構上來看，Composer 是一種混合專家（MoE）模型，支持長上下文的生成與理解。它通過在多樣化的開發環境中進行強化學習，針對軟件工程進行了專項優化。每次訓練迭代中，模型都會接收問題描述，並被指示產出最佳響應，無論是代碼修改、方案規劃，還是信息性回答。模型既能使用讀取與編輯文件等簡單工具，也能調用更強大的能力，例如終端命令和麪向整個代碼庫的語義搜索。

為衡量進展，他們構建了一套儘可能貼近軟件開發者實際使用價值的評測。新基準測試 Cursor Bench 由 Cursor 的工程師和研究人員提交的真實智能體請求組成，並配有人工精心整理的最佳解決方案。該評測不僅考察智能體的正確性，還評估其對代碼庫既有抽象與軟件工程實踐的遵循程度。

強化學習使他們能夠有針對性地優化模型，以更好地服務高效的軟件工程。鑑於響應速度是交互式開發的關鍵，他們鼓勵模型在工具使用上做出高效選擇，並在可能的情況下最大化並行處理。此外，他們通過減少不必要的回覆、避免無依據的陳述來訓練模型。他們還發現，在 RL 過程中，模型會自發習得一些有用的能力，例如執行復雜搜索、修復 linter 錯誤，以及編寫並運行單元測試。

Composer 已經被 Cursor 自己的工程團隊在日常開發中使用 —— 這表明其成熟度和穩定性。

目前，Composer 已完全集成到 Cursor 2.0 中，這是該公司智能開發環境的一次重大更新。

多智能體界面

Cursor 的界面設計也進行了更換。

其博客介紹説，這一版本更加聚焦，徹底以「智能體」為中心，而非傳統的文件結構。這樣用户就能專注於想要的結果，而讓智能體處理繁瑣的細節。當需要深入代碼時，用户也可以輕松在新佈局中打開文件，或切換回經典的 IDE 界面。

Cursor 2.0 能夠輕松並行運行多個智能體，它們之間互不干擾。這得益於 git worktree 或遠程機器的支持。Cursor 表示：「我們甚至發現，讓多個模型同時嘗試同一問題並擇優採用，能顯著提升最終結果，尤其是在更難的任務上。」

every.to 博客分享了一些測試示例，比如在下面的示例中，在頂部欄中，可以看到三個不同的模型上運行了相同的任務：Composer 1 Alpha 運行了兩次，Grok Code 運行了一次：

該博客寫到：「現在，開發者可以同時運行多個 AI 智能體，每個智能體負責項目的不同部分，每個部分被稱為一個工作樹（work tree）。這相當於一羣實習生各自負責這篇文章的不同章節，並同時向我匯報工作。」

另外，Cursor 官方還提到，隨着他們更多地使用智能體進行編碼，出現了兩個新的瓶頸：代碼評審與變更測試。

Cursor 2.0 也開始解決這兩個問題。支持更快速地審閲智能體的變更，並在需要時深入代碼。

同時，他們還構建了原生瀏覽器工具，使 Cursor 可以測試其工作並持續迭代，直到產出正確的最終結果。

基礎設施

高效訓練大型 MoE 模型需要在基礎設施與系統研究方面進行大量投入。團隊基於 PyTorch 和 Ray 構建了定製化訓練基礎設施，以在大規模環境下支持異步強化學習。他們通過將 MXFP8 MoE kernels 與專家並行和混合分片數據並行相結合，在原生低精度下訓練模型，從而以極低的通信開銷將訓練擴展到數千張 NVIDIA GPU。此外，採用 MXFP8 訓練還能在無需訓練后量化的情況下實現更快的推理速度。

在進行 RL 時，團隊希望模型能夠調用 Cursor Agent 框架中的任意工具。這些工具可用於編輯代碼、進行語義搜索、使用 grep 查找字符串，以及運行終端命令。以 Cursor 的規模，要讓模型高效調用這些工具，需要在雲端併發運行數十萬份隔離的沙盒編碼環境。爲了承載這類工作負載，團隊對既有的 Background Agents 基礎設施進行了改造，重寫了虛擬機調度器，以適配訓練運行的突發性與規模。由此，他們將 RL 環境與生產環境實現了無縫統一。