熱門資訊> 正文
2026-06-05 20:23
6月5日,騰訊混元宣佈提出Stem稀疏注意力算法,已被機器學習頂會ICML-26收錄。根據Stem算法×HPC算子的全棧加速方案,算法層面,Stem通過Token位置衰減(TPD)和輸出感知度量(OAM)實現25%預算下的近無損精度;算子層面,HPC開源的Stem+BSA算子將稀疏收益轉化為真實硬件加速,128K上下文下首字延迟降低3.7倍。