原创精选> 正文
2017-01-31 00:00
深度学习算法(尤其是深度神经网络)带来了人工智能(AI)的各种突破,进而带动了AI市场的飞速发展,人工智能得到广泛应用,其中的商业利润暴涨。根据市场研究和咨询机构Tractica的数据,2016年全球AI营收达6.437亿美元,预计到2025年营收将增至370亿美元,年增长率约为50%。深度学习涉及大量矩阵计算,而GPU的并行计算架构正好满足需求,适合训练和评估神经网络,因此最前沿的深度学习平台全部使用GPU进行计算。作为GPU市场的领头羊,面对火爆的AI市场,英伟达(NASDAQ:NVDA)公司迅速布局,很快便成为了AI市场的主流硬件供应商。
当前英伟达的两大AI业务为数据中心和自动驾驶。据最新季报数据,数据中心和自动驾驶营收分别达2.4亿美元和1.27亿美元,而主营业务游戏芯片的营收高达12亿美元。尽管当前AI营收明显低于游戏芯片的营收,但AI业务的增长相当快。2016年,英伟达公司的股价飙升了2.27倍,这明显反映出投资者对公司AI业务的未来增长抱有极高的期望。公司当前的PE约为55,远超英特尔公司(NASDAQ:INTC)的PE(17)。
鉴于投资者对英伟达的AI业务抱有厚望,导致公司股价随之飙升,本文接下来将阐述为何投资者不应对英伟达的AI业务增长太过乐观。笔者得出此观点并非因为英伟达与对手AMD存在潜在的激烈竞争,而是GPU芯片本身并非深度学习的最佳硬件选择。放眼当前用于深度学习的产品及2017年即将发布的新品,芯片在计算能力和功耗上将得到极大的改善。
GPU为何能成为深度学习的主流硬件
对深度神经网络(DNN)的训练涉及大量矩阵和向量操作,计算量相当大,尤其是当数据集较大、模型复杂、需要调参时更是如此。尽管CPU也可用来进行这类计算,但CPU主要用于通用计算,当应对深度学习需处理的数据类型和庞大工作量时,CPU的处理速度则不尽如意。
与CPU不同,GPU专门用于图像处理。图像处理的对象大多是线性数据(如矩阵),因此GPU的架构决定了其内在的并行计算能力更能提高深度学习的计算效率。所以,就训练DNN而言,GPU在计算能力上远超CPU也并不奇怪。
深度学习近几年来才为大家熟知,之前只是学术界闭门研究的对象而已,所以当深度学习的商业价值开始凸显时,市场上还未出现专门的深度学习硬件。因此,当前AI应用的芯片选择仅限于CPU和GPU,而GPU比CPU优势更明显。利用GPU的优势,英伟达紧抓机会,短期内即成为了芯片市场的龙头。
GPU的劣势
尽管GPU是当前深度学习应用最多且最先进的硬件,但GPU远非深度学习应用的最佳硬件选择。毕竟,GPU主要为视频游戏而生,而非深度学习。事实上,为深度学习定制设计的芯片将会比GPU有更出色的表现。
示例:
1.精度降低:有研究报告指出,添加大型网络时DNN的表现会下降,因为数字精度会降低至16位或甚至8位。这表明GPU的高精度算法将大材小用。在别的应用场景下,GPU对同样数据带宽的利用率可更高。
2.内存访问和缓存:通常情况下,DNN访问更多的是可预测的数据,而非GPU渲染过程中高频处理的高度非线性结构。作为游戏引擎的GPU在内在设计上更适合访问高度非线性结构,而非可预测的数据结构。因此专门为DNN设计的架构会显著提升数据吞吐量。
3.此外,众所周知,高性能的GPU耗能特别大,所以不适合在数据中心上使用。一般的服务器每小时耗电量达500至1200瓦左右。如果取平均功耗850w来计算,一个功耗200w的GPU就会使服务器的整体耗电量提高四分之一。这无疑会加剧数据中心自身就存在的高能耗问题。不过,相比之下,接下来介绍的芯片将非常节能。
ASIC更胜一筹
与GPU相比,为深度学习定制的专用集成电路(ASIC)未来将更适合AI应用。根据任务定制的ASIC拥有更强大的计算性能,而且能耗更低,很可能其成本也相对较低。
CPU比GPU应用面更广,但GPU在处理特定作业上(如本文所讲的处理图像)远胜过CPU,GPU与ASIC相比也是如此,GPU比ASIC应用更广,但处理深度学习作业上ASIC远胜过GPU。
1.ASIC拥有更强大的计算性能。
2016年,英特尔以预计3.5至4亿美元的价格收购了一家成立两年的AI公司Nervana。Nervana将在2017发布基于ASIC的深度学习引擎,可解决上述GPU存在的各种不足(计算精度、缓存和数据吞吐量)。Nervana称,其ASIC芯片的计算能力远超过当前最先进的GPU。公司同时指出,当前的ASIC芯片采用的是28nm工艺,未来采用16nm工艺制作的ASIC芯片将会更加强悍。
Nervana芯片未来是否会削减英伟达的AI市场份额不得而知,但从上可知:首先,为深度学习而定制的ASIC芯片性能上可能远超传统的GPU;其次,Nervana公司成立仅两年,其设计深度学习芯片比设计GPU要容易的多,因为GPU的设计需要对应更复杂的应用,并且需要几十年的技术积累才能完成。
2.ASIC芯片更节能。
在降低能耗方面,凭借硬件配置最小化及使用低功耗电元件,ASIC不容置疑地成为节能冠军,深度学习应用的实时功耗数据可予以佐证。谷歌(NASDAQ:GOOG)(NASDAQ:GOOGL)已自主研发了一款ASIC芯片—即Tensor Processing Units(TPU),并且已将芯片用于处理多个机器学习任务。同时,与世界围棋冠军李世石进行对弈的AlphaGo身上也搭载了TPU。谷歌称同一能耗下,TPU的性能要比一般芯片强10倍。ASIC的强大节能可刺激其他科技公司研发定制的ASIC芯片,并将芯片应用到数据中心上。
3.ASIC的成本可能更低。
虽然笔者不了解Nervana或谷歌ASIC芯片的实际成本,但众所周知,半导体行业中,通用硬件的成本远高于定制硬件的成本。ASIC就属于定制芯片,所以笔者有理由相信商业投产后ASIC比GPU更有价格优势。
概要
总而言之,凭借在GPU市场的巨大市场份额,英伟达已成为AI应用的主流硬件提供商。从股价的疯涨可看出,投资者似乎对公司AI业务的持续增长充满信心。但在此笔者需指出,长期来看,当更多ASIC芯片趋于成熟并投入市场时,英伟达的霸主地位或许会被动摇。ASIC芯片的设计比GPU设计更简单,不需要进行数十年的技术积累即可完成,同时ASIC有可能在性能、功耗及价格上明显优于GPU。因此,英伟达在GPU市场的绝对优势并不能直接转换为公司在AI市场的绝对优势。笔者认为,未来英伟达在AI市场上可能面临激烈的竞争,投资者在投资决策前应考虑可能存在的风险。
免责声明:本文仅供参考,并非投资建议,我们将竭力提供专业可靠的信息。转载请注明来源,本公司将保留所有法律权益。