简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

全球市值第一 英伟达如何踏入AI计算芯片领域

2025-08-11 18:00

美国半导体巨头英伟达在6月初超过微软成为全球市值最高的上市公司之后,7月初公司市值突破4万亿美元,成为有史以来首家达到这一重要里程碑的企业,当时的股价触及164.32美元的历史最高点,而目前英伟达的股价已经超过了180美元。

市场普遍认为,英伟达这波股价的飙升,主要由于投资者对于人工智能变革潜力的坚定信心,并且英伟达的主要合作伙伴OpenAI也在近期发布了最新的GPT-5,英伟达的市值里程碑也凸显了企业正将资产支出转向AI领域的发展方向。

英伟达,最初是游戏芯片制造商,随后转型为加密挖矿芯片制造商,如今则成为人工智能计算芯片制造巨头,以及该领域无可争议的早期赢家。

那么,英伟达是如何踏入人工智能计算芯片领域的呢?

在《黄仁勋:英伟达之芯》一书中,作者为读者们呈现了当时英伟达是如何抓住了这个千载难逢的机会。

千载难逢的机会

英伟达何以快速转型

在提到英伟达的AI之路,需要先介绍一个重要的人物,那就是布莱恩·卡坦扎罗,他现任英伟达应用深度学习研究副总裁,领导团队探索从语言理解到计算机图形和芯片设计等多个领域的人工智能应用。

卡坦扎罗在本科学习期间曾经在英特尔做暑期实习生,当时英特尔让实习生也参与设计一款每秒能脉动100亿次的微芯片。经过计算,卡坦扎罗发现这个任务根本无法实现,他认为随着晶体管尺寸不断缩小,摩尔定律的极限已经触手可及,传统的计算机架构已经走到了尽头,然而英特尔却对此视而不见。

他坚信,解决之道在于重新设计微芯片,他在当时就推断出了并行计算的杀手级应用,答案就是人工智能。2011年,获得博士学位后,卡坦扎罗就加入了英伟达,并在研究所的扩展团队任职,最初被分配去研究编程语言,但很快他就成为英伟达的首位专职人工智能研究员。

他的上司当时在开发一项新技术,不过运用的是传统的计算架构,这项技术成本高昂,需要一个由2000CPU组成的集群,才能将1000万个Youtube视频缩略图输入神经网络系统之中,并且识图训练它识别猫的能力

这个项目耗资巨大,且耗电量惊人,但还是呈现出了一个引人瞩目的猫科动物表型特征的内部概念,英伟达的研究团队这才意识到,有趣的并非是神经网络能够识别动物,而是实现这一目标居然需要如此庞大的计算量。

这项任务随后交由卡坦扎罗用英伟达硬件来重现这个猫脸识别的试验,而他仅用了12GPU(图形处理器)就完成了整个实验。

在这之后,卡坦扎罗希望继续在英伟达寻求更多的资源支持,以帮助他在cuDNN构建上的工作。(cuDNN就像是英伟达显卡里的“ AI 特别加速器 ”,让训练和使用人工智能变得又快又省力,是深度学习软件背后的提速神器。)

但出乎他意料的是,2013年春,当他满怀希望地向英伟达软件团队展示自己初步构建的cuDNN原型时,却遭到了团队的否定。

于是,卡坦扎罗在当时做了一个普通打工人绝对不敢轻易尝试的举动:他越级直接向黄仁勋陈述了自己的观点。

当时,这项技术似乎还没有进入黄仁勋的视野,在同年3月的GTC大会上,黄仁勋谈及气候建模与移动图像的话题,却对神经网络只字未提。但在与卡坦扎罗的首次会面之后,黄仁勋便产生了浓厚的兴趣,整整一个周末都埋头钻研人工智能这一他之前几乎未曾涉猎的领域。而在随后的会面中,卡坦扎罗惊讶发现黄仁勋对于神经网络的理解已然与他旗鼓相当,甚至可能更为深入。

黄仁勋更在自己的办公室里告诉卡坦扎罗,他本人视cuDNN为公司20年历程重最为重要的项目。黄仁勋在办公室的白板上写下:OIALO,即Once In A lifetime Opportunity——千载难逢的机会。

当然,黄仁勋也表示自己有时需要一些时间去接纳新的观念,但在人工智能方面,他经历了一次深刻的顿悟后就迅速明白了,甚至比所有人都快。

黄仁勋认为这是因为他基于第一性原则在进行推导:既然它们能解决完全无结构的计算机视觉问题,那就引出了一个问题——还有什么可以教给它们?答案似乎是:所有事物。

他断定神经网络将彻底变革社会,而他可以通过CUDACompute Unified Device Architecture,是英伟达推出的一种能够让普通程序员更方便地用来控制和利用GPU进行通用计算的编程平台和开发工具包)占据必要的硬件市场。

随即,黄仁勋开始举全公司之力投入该项目的研究和发展,并在随后的某一个周五晚间在内部发了电子邮件宣告公司将全面转向深度学习,不再只是一家图形芯片公司。而到了周一早上,英伟达便已经转型为一家AI芯片公司。

转变就是这么快。

加速演化

软件与硬件共同激发AI变革

在人类的大脑组织中,每个神经元平均维持着约1000个与其他相邻神经元的突触连接。大脑通过化学方式改变这些连接,而神经网络则通过矩阵乘法来实现这一改变。

矩阵乘法是通过结合2个网格的数字来生成第3个网络。虽然规则并不复杂,担当规模增大时,计算量会急剧上升。这使得矩阵乘法非常适合并行处理。然而,在神经网络兴起之前,英伟达并未将矩阵成为视为重点。

AI及深度学习领域里非常重要的一个经典神经网络模型——AlexNet,在2012ImageNet图像识别比赛中首次提出,并一举拿下冠军。简单来说,AlexNet就是一只超级聪明的AI看图机器,靠多层神经元分层处理图片。

AlexNet使用了65万个神经元来模拟6300万个突触连接,在这样的规模下,单个突触的影响几乎可以忽略不计。相较于序列代码对错误的极度敏感(有时一个错误的符号就可能导致整个操作系统崩溃),神经网络则对错误的容忍度高很多。

基于这一观察,在开发cuDNN时,英伟达的程序员在精度和速度之间做出了新的权衡。他们认为,优秀的神经网络软件应更注重速度而非精度。也就是说,随着网络规模的扩大,训练准确率将不再是唯一的关注点,用户能否快速获得答案同样重要。

书中举了一个例子,大家可以想象一位无所不知的专家,他能够给出准确的回答,但是,每小时仅吐露一个字。

尽管推理过程所需的算力低于训练阶段,但随着时间的推移,它在cuDNN库中的重要性日益凸显。

回过头来看,其实20世纪50年代起,人工智能技术历经数次炒作,最终多尴尬收场。卡坦扎罗与该领域的所有研究者一样,对AI在商业领域过往的滑铁卢也心知肚明,同样担忧其再次让市场和投资者失望。

时间来到2014年初,cuDNN在当年的GTC大会上,由黄仁勋登台推荐,这是英伟达21年历程中首次公开与AI的结合。随后,卡坦扎罗登台,运用AlexNet的改良版来识别社交媒体上发布的狗狗品种,并在网络的实时运行中,成功辨识出了多个犬种。

而在两年后的2016年,谷歌研发出来的AlphaGo,同样是一种神经网络,在一系列扣人心弦的围棋对决中,战胜了围棋大师李世石。并随着谷歌在AI方面的深耕,其对GPU的需求日益凸显。谷歌的“麦克卡车项目”的终极成果预计将使用超过4万个英伟达的GPU,投入资金超过1.3亿美元,这一订单也成了英伟达有史以来接到的最大单笔订单。

而且,这还仅仅只是一个开端。

随着AI不断取得突破,并行计算也迎来了发展的新曙光。深度学习不仅是软件的革命,同样也是硬件的革命,两者的结合才会催生出理想的形态。可以说,在并行计算机上运行的神经网络,就像是新型强大生命体的DNA双螺旋结构,将在未来重塑人类文明。<完>

福利社新活动

根据微信后台数据,为过往历史文章“点赞”及“点❤”最多的读者送上精美周边:本期为“睿见读书会”磁吸书签一套。

请获奖读者后台联系小编。

注:微信公众平台提供过去15日内的阅读统计数据,本次统计截至8月10日。每位读者每期仅获得一个类别的奖项。

本期获奖名单

点赞最多

欣生万法

点❤最多

茶木龙

风险提示:本公司承诺以诚实信用、勤勉尽责的原则管理和运用基金财产,但不保证基金一定盈利,也不保证最低收益,投资者投资于本公司基金时应认真阅读相关基金合同、招募说明书等文件并选择适合自身风险承受能力的投资品种进行投资。基金过往业绩并不预示其未来表现,基金管理人管理的其他基金的业绩也不构成基金业绩表现的保证。本文观点仅代表个人,不代表公司立场,仅供参考,不作为投资建议。基金投资有风险,请审慎选择。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。