繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

首字延迟降低3.6倍,騰訊混元提出Stem稀疏注意力算法

2026-06-05 20:23

6月5日,騰訊混元宣佈提出Stem稀疏注意力算法,已被機器學習頂會ICML-26收錄。根據Stem算法×HPC算子的全棧加速方案,算法層面,Stem通過Token位置衰減(TPD)和輸出感知度量(OAM)實現25%預算下的近無損精度;算子層面,HPC開源的Stem+BSA算子將稀疏收益轉化為真實硬件加速,128K上下文下首字延迟降低3.7倍。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。