热门资讯> 正文
2025-08-19 16:30
当碎片化的算力需求被整合,“系统总规划师”的价值才真正显现!
在拉斯维加斯CES展台的聚光灯下,AMD CEO苏姿丰展示着最新AI芯片;在2025年汉堡的高性能计算大会上,AMD Instinct MI350加速器引发行业震动;在中国南京的AMD ROCm实验室中,开发者们正基于ROCm平台开发创新应用。
这些看似割裂的场景,却串联起一个芯片设计巨头向AI系统级解决方案提供者的惊人蜕变。2022年年底,Open AI的Chat GPT横空出世,在掀起全球AI狂潮的同时,也让那些全球的科技巨头们猛然发现:起初支撑大语言模型训练的“算力堡垒”基石已经出现松动。传统芯片性能的线性增长已无法匹配指数级膨胀的模型参数,单一硬件指标的较量陷入瓶颈。行业痛点赤裸呈现——谁能提供从数据中心到端侧边缘侧的系统级集成的优化方案,就能真正驾驭这场AI带来的算力革命。
01
芯片巨头的战略布局
“过去我们致力于打造出最快的单颗芯片,而如今我们已经更专注于如何将芯片与软件结合,满足AI最苛刻的计算需求。”AMD高级副总裁,大中华区总裁潘晓明在不久前的访谈中表示。当客户需要的不再是孤立的性能指标,而是应对万亿参数模型训练的整体方案时,这家芯片设计巨头战略重心发生了根本性的转变。潘晓明表示:“AMD认为AI是50年来最大的科技转型,AMD现在是‘All in AI’。仅过去一年就进行了超过25笔相关收购和投资。”
2022年以350亿美元鲸吞FPGA龙头赛灵思(Xilinx)使芯片能根据任务实时重构计算架构;整合DPU新锐Pensando获得的数据处理单元,补全了高速网络传输的关键拼图;49亿将系统集成专家ZT Systems收入麾下,获得了上千名机架设计专家,不久后又将数据中心基础设施制造业务剥离,这一度让市场捉摸不透。
潘晓明向我们透露了关于对ZT Systems“一买一卖”背后的生态合作智慧,他说:“因为当时收购ZT这个动作让很多与AMD长期合作的硬件厂商十分紧张,以为AMD要来抢服务器制造业务。生态合作是AMD非常重视的,所以很快就把ZT的服务器制造业务给出售了,意在告诉市场和合作伙伴,AMD还是一如既往专注发展设计能力,不会靠并购而盲目扩展业务范围,我们更看重与长期合作伙伴的战略协同,术业有专攻。”完成被行业称为“精准的外科手术式收购”后,AMD补全了从晶体管到机柜再到数据中心系统建设完整能力的拼图。
潘晓明还向我们讲述了在复杂的、需要低延迟和实时处理的边缘环境中,AMD是如何通过多项技术和解决方案帮助客户实现低时延与高能效的AI部署:
首先,AMD的处理器架构集成了专用的AI计算引擎,使得CPU不仅能够执行通用计算,还能高效处理AI任务。这种集成减少了对外部加速器的需求,提高了能效,确保在边缘设备中实现快速响应;其次,AMD支持异构计算平台,能够在应用处理器(CPU)、图形处理单元(GPU)、神经处理单元(NPU)与FPGA之间高效分配工作负载。这种灵活性使得不同类型的计算任务可以得到最优处理,提升整体系统性能。
再者,AMD的解决方案注重实时数据处理。通过高效的数据同步和前后处理流水线,能够确保边缘设备在高速和大量数据涌入的环境中实时运行,满足低时延的需求。这对于需要快速决策的应用场景至关重要。此外,AMD还鼓励使用新颖的数据格式来减少模型的内存占用,这在嵌入式设备中尤为重要。同时,开发特定领域的模型可以简化模型复杂性,从而降低部署的难度。
在工业领域,AMD的Kria SOM正在帮助客户为移动工业机械构建视觉系统,提供强大的处理能力来执行复杂的图像处理任务,从而提供高分辨率图像处理和 AI分析,直接提高自主及半自主工业机器的安全性;
在机器人领域,Kria SOM还帮助构建基于 AI 的开源数字孪生仿真工具,助力打造安全、人性化的机器人。
在汽车领域,AMD的第二代Versal AI Edge自适应SoC正助力领先车企打造下一代安全系统。AMD的自适应SoC能提供高性能、超低时延及功能安全能力,这些都是准确描绘和响应动态驾驶场景所必需的。通过将立体摄像头与AI推理功能相结合,不仅能提升图像处理速度,还能进一步提高推理速度。
02
开源才是终局?AMD的生态战略
“AMD一向鼓励竞争,也欢迎竞争,因为我们的战略重点从来不是盯着与竞争对手的差距。实际上,单颗芯片性能已经拉不开差距了,未来将是系统集成、解决方案和生态服务之间竞争!”AMD在持续构建差异化的价值是通过领先的芯片、软件生态和系统集成,推动开放的AI生态系统让愿景落地。”这是潘晓明向我们表达AMD面对AI行业竞争加剧的态度。
相比友商用软件生态构筑的铜墙铁壁,AMD选择了一条截然不同的突围路径:开放生态战略。当行业被单一的生态架构锁定的风险日益凸显,AMD的ROCm开放软件栈正在成为开发者的逃生通道。
封闭的花园再美,终究是囚笼。微软、Meta、OpenAI等巨头选择与AMD合作,正是看中其避免被单一厂商锁定的价值。在软件生态方面,AMD的ROCm 7不仅支持TensorFlow/PyTorch等主流框架,更推出Developer Cloud实现开发环境开箱即用。为了让更多的开发者赋能,AMD计划通过开发者大赛、技术讲座,骇客松竞赛,联合实验室(如与武汉大学、重庆交通大学、武汉纺织大学合作)等方式,推动本地开发者基于ROCm开放平台进行不断创新。
在硬件的技术路线图上,AMD继续保持着每年迭代的进攻节奏,这种持续创新的底气带来的是:当客户陷于竞争对手带来的单一GPU路径风险时,AMD可以给出CPU+GPU+FPGA甚至是NPU的“组合拳”,在推荐算法等场景实现毫秒级响应。
除了核心硬件和软件生态,AMD还联合了伙伴建立了新的AI数据中心加速器互联技术——UALink,这是由AMD、Broadcom、Google、Intel等科技行业领军企业联合发起的UALink倡议,致力于构建一种开放、高速且低延迟的互联技术标准。全面开源是其最大的特点和优势,潘晓明将其比喻成Type C接口对Lightning Dock接口的挑战。而就在今年年初,UALink联盟多了一位中国成员,阿里云加入该联盟,并将这项互联技术推荐到了我国的ODCC(开放数据中心委员会),国内的运营商和很多互联网大厂都是ODCC的会员,也包括AMD,这对于UALink技术在中国的推广将起到至关重要的作用。
当谈起AMD不久前与生态伙伴联合拿下中东500MW数据中心,价值100亿美元项目时,潘晓明表示:“AMD作为一家在硬件、软件和解决方案层面全面坚持开放的公司,这一合作本身就是对AMD‘系统总规划师’和生态融合战略的一种认可,我们还是那个理念,开放带来更多竞争、更快创新,最终让用户受益。”
AI市场非常大,这一点毋庸置疑。用CEO Lisa Su博士所讲,AI是50年来最重要的技术变革。将在未来的十几年到几十年里改变我们的工作、生活、学习等方方面面。AI的到来需要无处不在的AI引擎(芯片),为此AMD all in AI, 为AI做出了从云、边、到端的全栈AI解决方案,作为AI的赋能者随时做好准备。
回望半导体产业演进史,每次技术革命都伴随着价值链的重构。英特尔统治PC时代靠的是x86架构,英伟达制霸AI初期凭借GPU+CUDA组合,AMD此次向“系统总规划师”的跃迁,实则是AI算力时代重构产业规则。归结为三重突破:通过全栈能力打破硬件边界,以开放生态瓦解封闭和垄断,用系统思维替代单点竞速。
《孙子兵法》有云:“善战者,求之于势,不择于人”。
AMD所谋之势,是AI算力从硬件竞赛转向系统集成优化的产业变局。这场转型能否真正撼动既有的格局?答案藏在客户机房的能效账单里,也藏在开发者调用的ROCm接口中,更在那些部署于工厂的实时推理系统内——当碎片化的算力需求被整合,“系统总规划师”的价值才真正显现。
本文作者 | 刘超然 来源 | 英才商业