简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

Microsoft Azure创下110万代币/秒人工智能推理记录

2025-11-04 17:55

微软(MSFT)表示,其Azure ND GB 300 v6虚拟机在由Nvidia(NVDA)GB 300图形处理器支持的单个机架上每秒处理110万个令牌,创下了新的人工智能推理记录。

性能测试使用Llama 2 70 B生成式文本模型和Nvidia TensorRT-LLM开源库进行,用于优化大型语言模型推理。

该测试显示,速度提高了27%,从每个上一代Nvidia Blackwell图形处理器的12,022个令牌/秒提高到每个Blackwell Ultra图形处理器的15,200个令牌/秒。它还比之前的Azure ND GB 200 v6记录(每秒865,000个代币)高出27%。

微软首席执行官萨蒂亚·纳德拉(Satya Nadella)表示,这一结果“创造了我们与英伟达(NVIDIA)和Azure在大规模运行人工智能方面的专业知识的联合创新,创造了行业纪录”。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。