热门资讯> 正文
2025-08-14 22:30
金吾财讯 | 据外媒引述三位知情人士表示,中国人工智能公司DeepSeek因未能使用华为晶片进行训练,推迟其新模型的发布。报道知情人士表示,DeepSeek在1月发布R1模型后,被鼓励采用华为的升腾(Ascend)处理器,而非使用英伟达(NVDA)来进行AI模型训练。在公司在使用升腾晶片训练R2模型的过程中遇到技术问题,促使其改用辉达晶片进行训练,并使用华为晶片进行推理。知情人士向媒体表示,这些问题是模型从5月延迟发布的主要原因。