熱門資訊> 正文
2026-05-09 11:26
5月9日,螞蟻百靈發佈萬億級旗艦思考模型Ring-2.6-1T,專為複雜真實任務場景設計。模型創新引入可調節Reasoning Effort機制,支持high與xhigh兩檔推理強度。
在真實任務執行類評測中,PinchBench得分87.6,高於GPT-5.4x High、Gemini-3.1-Pro high與Claude-Opus-4.7x high;在高難推理任務上,ARC-agi-V2得分77.78,與Gemini-3.1-Pro high和Claude-Opus-4.7x high處於同一水位。
