简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

华为版CUDA,全面开源了

2025-08-06 16:14

红交 发自 凹非寺

量子位 | 公众号 QbitAI

华为版本CUDA,全面开源开放!

最新消息,华为宣布为其昇腾AI GPU开源其CANN软件工具包。

华为轮值董事长徐直军在主题演讲中强调:华为AI战略的核心是算力,并坚持昇腾硬件变现。

基于这一背景下,徐直军在会上宣布华为昇腾硬件使能CANN全面开源开放,Mind系列应用使能套件及工具链全面开源,支持用户自主的深度挖潜和自定义开发,加速广大开发者的创新步伐,让昇腾更好用、更易用

CANN,神经网络计算架构,提供多层编程接口,帮助用户构建针对华为昇腾的AI应用程序。

它是一个由多种技能栈和算子加速库等组成的软件生态系统,换句话说,它就像是华为版本的CUDA,为GPU提供相同的接口。

巧合的是,同一天,一传奇GPU大佬创业公司终于浮出水面,他们不搞消费级GPU,而是做CUDA类似软件生态系统。

看来,想要挑战英伟达的玩家可真不少。

华为版CUDA全面开源

过去,开发者苦于CUDA封闭生态系统久矣。

除了英伟达自身硬件,CUDA几乎不支持其他第三方,因此开发者如果想用CUDA来构建软件,就只能使用英伟达的GPU。这其实也构成了英伟达的核心壁垒。

因为一旦开发者想要迁移到其他产品。那么就需要重写代码,使用生态相对不成熟的替代库,同时也会失去英伟达围绕CUDA建立起来的庞大技术社区的支持。

之前有项目尝试将CUDA功能(通过转换层)引入其他 GPU供应商,但由于英伟达阻拦,这些项目大多未能成功。2024年CUDA 11.6版开始,就禁止使用转换层。

如今,在昇腾计算产业发展峰会上,华为宣布开源CANN架构,以及Mind系列应用使能套件及工具链也跟着开源,那么开发者可以自主深度挖掘昇腾GPU的潜力。

目前CANN已经升级到8.0版本,它主要提供两个版本:社区版,提供新功能的早期体验;商业版,提供专为企业用户量身定制的稳定版本。两个版本都更新到了8.2.RC1版本新增适配12款操作系统。

与CANN配套的,还有华为自研深度学习框架MindSpore,其作用类似于PyTorch,这些工具共同构成了华为原生的AI软硬件方案。

截至目前,CANN已支持包括PyTorch、MindSpore、TensorFlow、飞桨、ONNX、计图、OpenCV和OpenMMLab等深度学习框架与第三方库。

在会上,与会代表和华为还共同发起了《CANN开源开放生态共建倡议》。

看来在构建开源开放的昇腾生态这件事儿上,华为已经开始大力出手了。

传奇GPU架构师创业,对标英伟达CUDA

而挑战英伟达CUDA生态的,业内还有不少玩家。

比如就有一位传奇GPU架构师Raja Koduri,宣布创立了一家GPU初创公司Oxmiq Labs。

他曾效力于AMD、苹果、英特尔等,曾在英特尔担任加速计算系统和图形(AXG)业务执行副总裁。加入英特尔之前,他曾担任AMD的图形部门Radeon Technologies Group的高级副总裁兼首席架构师。

而现在创立的这家公司专注于开发GPU硬件和软件IP,并将其授权给各方。他将这家公司定位为硅谷25年以来第一家GPU初创公司。

不过他们不打造消费级GPU,也不开发GPU所需的所有IP模块,他们提供一个垂直集成平台,该平台将GPU硬件IP与功能齐全的软件堆栈相结合,旨在满足AI、图形和多模态工作负载的需求,在这些工作负载中,显式并行处理至关重要。

在硬件方面,Oxmiq提供了一个基于RISC-V指令集架构(ISA)的GPU IP核OxCore,该核将标量、矢量和张量计算引擎集成在一个模块化架构中,并支持近内存和内存计算功能。

Oxmiq还提供基于芯片集(chiplet)的系统级芯片(SoC)构建器OxQuilt,使客户能够根据特定工作负载需求,快速且经济高效地创建集成计算集群桥接器(CCB,可能集成OxCores)、内存集群桥接器(MCB)和互连集群桥接器(ICB)模块的SoC。

例如,用于边缘应用的推理AI加速器可以封装一个或两个CCB和一个ICB,推理SoC则需要更多CCB、MCB和ICB,而用于AI训练的大规模SoC则可能封装数十个芯片集。

Oxmiq尚未透露其OxQuilt是仅支持构建多芯片集系统级封装(SiP),还是也可用于组装单片处理器。

不过他们的软件业务似乎更为核心和关键。他们提供的软件包可以兼容第三方的硬件,支持在各种硬件平台上部署AI和图形工作负载。

该软件堆栈的核心是OXCapsule,这是一个统一的运行时和调度层,用于管理工作负载分配、资源平衡和硬件抽象。

[3]https://www.tomshardware.com/tech-industry/artificial-intelligence/legendary-gpu-architect-raja-koduris-new-startup-leverages-risc-v-and-targets-cuda-workloads-oxmiq-labs-supports-running-python-based-cuda-applications-unmodified-on-non-nvidia-hardware

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。