繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

剛剛,Cursor 2.0攜自研模型Composer強勢登場,不再只做「殼」

2025-10-30 11:28

Cursor 2.0 終於來了!

剛剛,Cursor 發佈了兩項重大更新:首個編碼模型 Composer,以及用於並行協作多個智能體的新界面。

此舉意義非凡。一直以來,Cursor 雖然廣受歡迎,但終究免不了「AI 時代的 VS Code」的帽子,因為它此前只能使用 Claude、GPT 等第三方模型。這既是 Cursor 的起點,也成了它的瓶頸。

Composer 的發佈,堪稱是 Cursor 打破這個瓶頸的「獨立宣言」,這也標誌着 Cursor 正式從「AI 外殼」向「AI 原生平臺」進化。

自研模型 Composer

Composer 是一款前沿模型,雖然智能程度不敵 GPT-5 等最佳前沿模型,但速度確實遙遙領先,達到了同等智能模型的 4 倍。

在基準測試中,Composer 實現了前沿水平的編碼智能,同時生成速度達到每秒 250 個 token—— 大約是領先的快速推理模型的兩倍,是同類前沿系統的四倍。(注:Cursor 發佈的對比將模型分為幾個類別:「最佳開源」(例如,Qwen Coder、GLM 4.6)、「快速前沿」(Haiku 4.5、Gemini Flash 2.5)、「2025 年 7 月前沿」(年中可用的最強模型)以及「最佳前沿」(包括 GPT-5 和 Claude Sonnet 4.5)。Composer 在匹敵中端前沿系統智能水平的同時,還在所有測試類別中實現了有記錄以來的最高生成速度。)

該模型專為在 Cursor 中進行低延迟的智能體式編碼而打造,大多數回合在 30 秒內完成。早期測試者認為其快速迭代的能力非常順手,並願意信任它處理多步驟編碼任務。

官方表示,Composer 通過一組強大的工具進行訓練,包括覆蓋整個代碼庫的語義搜索,因此在理解與處理大型代碼庫方面顯著更強。

具體來説,在訓練過程中,Composer 可使用一套生產級的搜索與編輯工具,並被要求高效解決各類棘手問題。

該模型的研發動力源於 Cursor 團隊在開發 Cursor Tab(自研的補全模型)時的經驗。

他們發現,開發者往往希望使用既足夠智能又能支持交互式使用的模型,以保持編碼的專注與流暢。在研發過程中,他們試驗了一個代號為 Cheetah 的原型智能體模型,以更好地理解更高速智能體模型的影響。Composer 是該模型的更智能升級版,憑藉足夠的速度支撐交互式體驗,讓編碼始終愉快順滑。

從架構上來看,Composer 是一種混合專家(MoE)模型,支持長上下文的生成與理解。它通過在多樣化的開發環境中進行強化學習,針對軟件工程進行了專項優化。每次訓練迭代中,模型都會接收問題描述,並被指示產出最佳響應,無論是代碼修改、方案規劃,還是信息性回答。模型既能使用讀取與編輯文件等簡單工具,也能調用更強大的能力,例如終端命令和麪向整個代碼庫的語義搜索。

為衡量進展,他們構建了一套儘可能貼近軟件開發者實際使用價值的評測。新基準測試 Cursor Bench 由 Cursor 的工程師和研究人員提交的真實智能體請求組成,並配有人工精心整理的最佳解決方案。該評測不僅考察智能體的正確性,還評估其對代碼庫既有抽象與軟件工程實踐的遵循程度。

強化學習使他們能夠有針對性地優化模型,以更好地服務高效的軟件工程。鑑於響應速度是交互式開發的關鍵,他們鼓勵模型在工具使用上做出高效選擇,並在可能的情況下最大化並行處理。此外,他們通過減少不必要的回覆、避免無依據的陳述來訓練模型。他們還發現,在 RL 過程中,模型會自發習得一些有用的能力,例如執行復雜搜索、修復 linter 錯誤,以及編寫並運行單元測試。

Composer 已經被 Cursor 自己的工程團隊在日常開發中使用 —— 這表明其成熟度和穩定性。

目前,Composer 已完全集成到 Cursor 2.0 中,這是該公司智能開發環境的一次重大更新。

多智能體界面

Cursor 的界面設計也進行了更換。

其博客介紹説,這一版本更加聚焦,徹底以「智能體」為中心,而非傳統的文件結構。這樣用户就能專注於想要的結果,而讓智能體處理繁瑣的細節。當需要深入代碼時,用户也可以輕松在新佈局中打開文件,或切換回經典的 IDE 界面。

Cursor 2.0 能夠輕松並行運行多個智能體,它們之間互不干擾。這得益於 git worktree 或遠程機器的支持。Cursor 表示:「我們甚至發現,讓多個模型同時嘗試同一問題並擇優採用,能顯著提升最終結果,尤其是在更難的任務上。」

every.to 博客分享了一些測試示例,比如在下面的示例中,在頂部欄中,可以看到三個不同的模型上運行了相同的任務:Composer 1 Alpha 運行了兩次,Grok Code 運行了一次:

該博客寫到:「現在,開發者可以同時運行多個 AI 智能體,每個智能體負責項目的不同部分,每個部分被稱為一個工作樹(work tree)。這相當於一羣實習生各自負責這篇文章的不同章節,並同時向我匯報工作。」

另外,Cursor 官方還提到,隨着他們更多地使用智能體進行編碼,出現了兩個新的瓶頸:代碼評審與變更測試。

Cursor 2.0 也開始解決這兩個問題。支持更快速地審閲智能體的變更,並在需要時深入代碼。

同時,他們還構建了原生瀏覽器工具,使 Cursor 可以測試其工作並持續迭代,直到產出正確的最終結果。

基礎設施

高效訓練大型 MoE 模型需要在基礎設施與系統研究方面進行大量投入。團隊基於 PyTorch 和 Ray 構建了定製化訓練基礎設施,以在大規模環境下支持異步強化學習。他們通過將 MXFP8 MoE kernels 與專家並行和混合分片數據並行相結合,在原生低精度下訓練模型,從而以極低的通信開銷將訓練擴展到數千張 NVIDIA GPU。此外,採用 MXFP8 訓練還能在無需訓練后量化的情況下實現更快的推理速度。

在進行 RL 時,團隊希望模型能夠調用 Cursor Agent 框架中的任意工具。這些工具可用於編輯代碼、進行語義搜索、使用 grep 查找字符串,以及運行終端命令。以 Cursor 的規模,要讓模型高效調用這些工具,需要在雲端併發運行數十萬份隔離的沙盒編碼環境。爲了承載這類工作負載,團隊對既有的 Background Agents 基礎設施進行了改造,重寫了虛擬機調度器,以適配訓練運行的突發性與規模。由此,他們將 RL 環境與生產環境實現了無縫統一。

網友點評

作為明星級 AI 編程工具,Cursor 的這次大版本更新自然也收穫了無數眼球。

參與過早期體驗的開發者紛紛給出好評。比如 every.to 博客就收集整理了多位開發者的意見反饋,其中有好有壞:

X 上也有不少網友分享自己的體驗。

已經有人玩笑式讓 Cursor 2.0 來構建 AGI 了:

參考鏈接:

https://x.com/cursor_ai/status/1983567619946147967

https://cursor.com/blog/2-0

https://every.to/vibe-check/vibe-check-cursor-2-0-and-composer-1-alpha

https://cursor.com/cn/changelog/2-0

本文來自微信公眾號「機器之心」,36氪經授權發佈。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。