热门资讯> 正文
2025-12-29 23:30
1、与其问“AI是不是泡沫”,不如问“聪明的钱在做什么”。谷歌在做什么?微软在做什么?亚马逊呢?还有一些国家在做什么?答案是:他们都在大举押注AI。
2、我敢说,如果今天给OpenAI和Anthropic的推理算力都翻一倍,那么从现在起一个月内,他们的收入几乎就能翻倍。
3、很多人无法真正理解“速度”在人类体验中的本能重要性。
4、我觉得做芯片有个误区:很多人以为最难的是把芯片造出来。但真正做下去之后,你会发现:最难的是软件。然后你继续做,就会意识到:真正最难的是跟得上行业的演进。
5、如果从价值的角度来看,或者说从“长期称重机”的角度来看,经济中最有价值的,其实是劳动力。而现在,通过提供更强的算力和更好的AI,我们实际上能够向整个经济体系里注入更多“额外劳动力”。这种事情,在人类经济史上从未发生过。
6、你应该让品牌信任度维持在尽可能高的水平,因为信任是有复利效应的。同样的道理,我认为利润率也应该低到一个水平,让客户觉得你始终在给他们一个好价格。
7、如果五年后它(英伟达)还没到(10万亿美元市值),我会很惊讶。
这是9月28日发布的播客中,Groq创始人乔纳森·罗斯(Jonathan Ross)的深度对话。内容干货满满本身就具有极强的时间价值。
而随着圣诞节英伟达爆出一则重磅新闻,将以约200亿美元收购AI芯片初创公司Groq,同时把创始人等核心高管纳入麾下,又让Groq与乔纳森的名字成为“引爆点”。
2016年成立的Groq,在今年9月中旬刚完成新一轮融资,融资额约7.5亿美元,对应投后估值约69亿美元。
随着一些细节披露,业界分析普遍认为,这笔交易实质上是英伟达通过“技术授权+人才收编+资产整合”来收编潜在竞争对手Groq,而不是传统股权并购,有助于绕开严格的反垄断审查、加快落地,同时又阻止Groq技术落入其他巨头手中。
根据英伟达CEO黄仁勋在内部邮件中所述,此次交易的战略目标十分明确:计划将Groq的低延迟处理器整合到英伟达的“AI工厂”架构中。此举旨在弥补英伟达自身在AI推理领域的结构性短板,以服务更广泛的AI推理和实时工作负载。
Groq的核心竞争力在于其专为AI推理设计的LPU芯片,其脱离了CUDA生态,而且用乔纳森·罗斯的话说,“我们最大的卖点之一是:供应链跟GPU的完全不一样。”
无论如何,这笔交易被外界视为英伟达有史以来最大手笔之一,也足以说明一件事:推理算力的供给与效率,正在成为新一轮竞赛的核心变量。
是时候把乔纳森·罗斯的一场深度对话,呈现给大家。这场对话正好发生于Groq融资之后的9月底,也是帮助我们理解AI浪潮底层逻辑的珍贵窗口。
他的判断之所以值得咀嚼,不只因为身处风口中央,更因为他的职业背景。
在创办Groq之前,乔纳森曾是谷歌TPU的核心缔造者之一,他对芯片研发周期、一次流片成功率、以及所谓“时间护城河”的理解,不是站在纸面上谈战略,而是建立在工程落地与供应链周期这些刚性约束之上。
在与哈里·斯特宾斯(Harry Stebbings)的对话中,乔纳森不断把话题callback到一个现实的问题:算力根本不够。并提到,市场至今仍在大量租用发布已久的H100,因为只要供不应求,旧芯片依然能持续盈利。
乔纳森说话直言不讳,表达精妙,很多观点非常值得一看,也有一些看法有点反直觉。
包括他用快消品来类比人类基因中对速度有本能的需求,以及谈到利润的意义在于“让公司有实力留在牌桌上”,以及用“称重器”的方式看待AI所以没有投资比特币等等,都让人听出丝丝价值投资者熟悉的味道。
而点评美股七巨头的内容,也格外精辟。
特别赞美推荐这场对话的韦华童鞋,他主理的微信公众号“苔藓花园播客”,聚焦深度商业思维,推荐关注。
2.5万字的大部头,小编精译整理分享给大家,值得耐心细读。
聪明的钱都在大举押注AI
哈里 我想从一个基本的问题开始,搞清楚我们现在究竟处在什么阶段。感觉这个世界变化速度比以往任何时候都更快。如果我们看当下的市场状态,你怎么判断?
乔纳森 你是想问,现在是不是有泡沫,对吧?
哈里 算是吧。
乔纳森 关于“有没有泡沫”这个问题,我的看法是:如果你反复问一个问题,却一直得不到清晰答案,也许你该换个问题来问。与其问“是不是泡沫”,不如问“聪明的钱在做什么”。
谷歌在做什么?微软在做什么?亚马逊呢?还有一些国家在做什么?
答案是:他们都在大举押注AI。他们的资本开支越来越多,几乎每一轮宣布投入的时候,金额都会比上一轮更高。
而这些投资所带来的价值,有个很有说服力的例子,就是微软:他们在某个季度部署了一批GPU,之后宣布这些GPU不会开放给Azure客户使用,因为他们自己用这些GPU赚的钱,比租出去赚得更多。
可见这个市场确实有巨大的商业潜力的。
要我说,现在这个市场特别像早期的石油钻探,遍地枯井却也偶见喷涌。
我听到的一个数据,目前AI领域中,大概有35或36家公司贡献了99%的收入,或者至少是99%的token消耗。
哈里 对,市场非常集中。我甚至有点意外,这个数字居然不是更少。说真的,你看英伟达,它的收入集中度也太高了,两个客户可能就占了绝大部分营收。
乔纳森 是啊,英伟达可能就占了那99%里的98%。
但当市场集中到这种程度时,说明它还处在非常早期的阶段。就像过去人们不知道怎么找油,只能靠直觉,几乎是靠感觉投资。那些直觉好的人会大赚一笔,其他人可能血本无归。
但随着时间推移,这会逐渐变成一门科学。它会变得更可预测、更稳定,市场也会变得更均衡。
但到了那个阶段,投资者的收益反而会下降,特别是那些本来能赚大钱的人,机会反而变少。
所以,我认为现在恰恰是投资人最好的时机。现在人们在AI上的整体收入多过支出,只是这个分布极其不均匀。
哈里 你是说,总体上赚得比花得多?
乔纳森 对,整体看是这样的,当然还是会有很多人赔得很惨,但总体来说,投入的资金少于产出的收益。
哈里 但你看看现在这些大厂的资本开支,每一家的反应都是“好,好,好”,因为他们相信,终点一定会有实实在在的成果。但问题是,资本开支还在不断上涨。
乔纳森 没错。哪怕你纯粹从财务角度考虑,我认为财务回报也是积极的。而现在很多人之所以愿意投入,真正的出发点并不是为了赚钱。
我前阵子去阿布扎比,参加了高盛在那儿办的首届活动(我们现在也在赞助迈凯伦车队)。
活动上,扎克·布朗(Zak Brown)有发言,我也发了言,现场气氛挺不错。然后有人问了我一个类似的问题:“AI是不是一个泡沫?”
我没有直接回答,而是问了全场一个问题:在座的各位,有谁能百分百确信,十年后AI不可能替代你的工作?
在场有五十多位资产管理规模超过100亿美元的投资人,没有一个人举手。
我说:“很好,这就是科技巨头们现在的真实想法。”
所以他们会像喝醉的水手一样继续疯狂砸钱,否则另一种可能性就是,他们会被彻底挡在核心业务之外。
他们现在根本不是在算经济账,而是在回答一个更关键的问题:我们能不能保住行业的主导地位?
接下来的发展,会越来越体现规模法则的影响。如果你没法留在前十名,你就没有定价权。
我们现在常说“美股七巨头”,如果你不在这七家里,你甚至连那个估值区间都不可能靠近。
那你要怎么保住这个位置?就得持续投入。
而只要你还在前七或前十,市场就会给你高估值,所以这笔投入是值得的。
哈里 但问题是,最终这些投入必须兑现成真正的、实打实的营收。如果兑现不了,那你是不是“七巨头”其实也就无所谓了,对吧?
乔纳森 你说得对。但现实是,AI已经开始释放巨大的价值了。只是这个价值在各类应用中分布得很不均匀,但它确实创造了巨大的价值。
我举个我们自己亲身经历的例子。
我尝试过通过prompt(提示)来编码。我自己写得不算好,但我们有几个实习生非常擅长。
有一次,一个客户来访,我和他们开了个会,他们现场提了一个功能需求。
我用很粗略、提示的方式描述了这个功能,然后把这些prompt给到工程师们。结果四个小时后,这个功能就上线了。整个过程中,没有一行代码是人手写的,也没有人调试,全是通过prompt完成的。
我们现在用Slack集成了提交代码的功能,所有操作就是在Slack里完成的。四小时后,功能就交付使用了。
你想想这个效率带来的价值有多大!
但如果你再往前想,六个月后,也许这个功能在客户会议还没结束之前就能完成上线,那就不仅是效率的差别,而是质的飞跃了,而不仅仅是节省了多少成本这么简单。
当然,从财务角度看,开发速度越快,你把功能推向生产环境所花的钱就越少,这是真金白银的投入产出比(ROI)。
但从“质”的角度看,当你能做到在客户会议结束前就把需求变成现实,你就能拿下那些竞争对手永远也拿不下的订单。
现在算力的需求是疯狂且无法被满足
哈里 我想回到“美股七巨头”这个话题。你觉得大家是否都意识到,要想保住七巨头的位置,就必须深入到芯片层,真正实现从头到尾的垂直整合?
乔纳森 我觉得你不会看到太多公司在芯片层成功突围。
很多人把谷歌的TPU看作一个巨大的成功,但他们不知道的是,谷歌其实当时同时在搞三种芯片项目,最后只有一种跑赢了GPU。
你再看看整个行业,有不少公司在做AI芯片,但也有不少项目被砍掉了,比如Dojo最近就被取消了。
造芯片真的很难。
如果一个公司说“我要造自己的AI芯片,来跟英伟达竞争”,这就像有人说:“嘿,谷歌搜索挺好的,我们来复制一个吧。”——这完全是疯了!
因为那种级别的芯片优化、设计、工程实现,难度太高了。你要复制它,成功的概率极低。
当然,如果市面上有很多人在尝试,而你有选择权,那只要其中有一个成功了,你就多了一颗芯片可选。
哈里 我们刚才也提到,为了保住“七巨头”的位置,你必须不断投入。比如英伟达投1000亿美元进OpenAI,OpenAI再拿这笔钱回头去买英伟达的芯片。这是不是就是个无限循环的资金游戏?
乔纳森 如果他们只是把钱绕一圈回给自己,那当然是。但问题是,这笔钱其实是拿去给供应商建芯片的,所以它不是一个资金空转。
换个角度想:这笔投入里,大约有多少比例是真正流向了芯片基础设施建设?40%。所以至少有40%的资金是进了整个供应链生态系统的。
这就不能算是一个无限循环。
哈里 那就是个“部分循环”?60%回到英伟达,40%流出去?英伟达确实拿回了60%,而他们的股价也因此涨了几千亿美元。你怎么看待这种结构?
乔纳森 那我们可以从不同角度来看它。
从经济学角度讲,这完全说得通。只要能带来(客户)锁定效应,那你当然愿意这么干。
为什么营收的增长能推动市值涨得比营收本身还多?就是因为市场相信这种增长是可持续的。
我觉得对英伟达来说,这个逻辑成立。但不只是因为英伟达厉害,虽然它确实非常强,还因为全世界的算力总量根本不够用。
真的,现在算力的需求是疯狂的、无法满足的。
我敢说,如果今天给OpenAI和Anthropic的推理算力都翻一倍,那么从现在起一个月内,他们的收入几乎就能翻倍。
哈里 等等,你能帮我拆解一下这句话吗?你是说他们因为算力受限,所以现在的营收被卡住了?但如果给他们双倍算力,为什么收入也能双倍?
乔纳森 现在,大家对Anthropic最大的抱怨之一就是限流太严重。用户根本拿不到足够token。如果他们有更多的算力,就可以生成更多token,进而收费更多。
而OpenAI提供的是聊天服务,那你怎么控制聊天服务的流量?办法就是让它变慢,结果就是用户互动减少。
哈里 你觉得速度到底有多重要?毕竟也有很多人认为:其实延迟也没关系,我完全可以接受有延迟。我输完prompt后,可以去干点别的,等它慢慢跑出结果。
乔纳森 嗯,这种观点吧……挺有意思的。
但我们可以看一个类比,比如CPG(快消品行业)。
我们来按照利润率,把快消品排个序:利润率最高的是卷烟,其次是嚼烟,再往下是碳酸饮料,再往下是瓶装水之类的。
那什么因素和高利润率最强相关?就是产品成分对你的作用速度。
也就是说,那种激活多巴胺的循环,越快生效,你对品牌的黏性就越强。
你越快感受到反馈,就越容易对那个品牌产生情感连接,也就越容易建立品牌价值。
这也是为什么谷歌如此强调速度,为什么Facebook不断优化响应速度。每提升100毫秒的加载速度,转化率就能提升约8%。
所以,那种“没关系,prompt可以在后台慢慢跑、用户等一等也行”的想法,完全是错的。百分之百错误。
当我们刚开始为芯片提升速度时,我们其实就知道自己能做到多快。我们甚至做了一个演示视频,展示了芯片的实际速度。
但很多人看完视频会说:“为啥还要比人类阅读速度更快?看得懂就行吧。”
我通常就反问他们:“那网页加载为什么要快于阅读速度呢?”
这里有一个认知断层,很多人无法真正理解“速度”在人类体验中的本能重要性。
人类其实很难判断哪些因素真的影响参与度和最终结果,但我们从早期互联网公司的经验里,早就明白了这一点。
自主研发芯片的核心动机
哈里 你觉得OpenAI最终会自研芯片吗?我想英伟达肯定会担心OpenAI也想搞垂直整合,把芯片环节也收入囊中。你觉得他们能成功吗?
乔纳森 我觉得做芯片有个误区:很多人以为最难的是把芯片造出来。但真正做下去之后,你会发现:最难的是软件。
然后你继续做,就会意识到:真正最难的是跟得上行业的演进。
我毫不怀疑OpenAI会自己做芯片,Anthropic也一样。未来每一家科技巨头都会自研芯片。
我记得在谷歌的时候,有一次参观实验室,那会儿AMD还不算太强(当然现在他们做得很好)。
我们当时部署了1万台服务器,全是用AMD芯片。
我走过实验室,看到他们把服务器从机架上拔下来,把AMD芯片拆掉,直接扔进垃圾桶。
哈里 真的假的……
乔纳森 真的。而且你可以说这是命中注定,因为当时所有人都知道,那一代芯片里英特尔会赢。
那谷歌为啥还要做1万台AMD服务器?很简单,他们是为了在采购英特尔芯片时拿到更好的价格。
当你是这种量级的玩家时,你会发现,为AMD设计自己的主板、搭建测试平台、部署生产……所付出的成本,完全值得换来英特尔的采购折扣。
所以当公司决定自己做芯片时,动机不一定是要量产部署,很多时候是出于博弈和议价策略。
还有个更少人知道的事实:英伟达现在在HBM(高带宽内存)上几乎处于买方垄断地位。
所谓买方垄断是垄断的反面——不是只有一个卖家,而是只有一个买家。
现在GPU里的HBM供应是有限的。GPU本身是用跟手机芯片一样的工艺制造的,所以如果英伟达愿意,他们每年可以生产5000万颗GPU核心。
但现实是,今年他们大概只会造出550万块GPU,原因就是HBM和中介层的产能限制。
于是情况就变成了这样:一家科技巨头走过来说:“我想要一百万颗GPU。”
英伟达回应:“不好意思,我还有其他客户。”
然后这家科技巨头反击说:“没问题,我自己造。”
然后你会发现,突然间英伟达就生产出一批GPU,优先给了这家公司。
现实是,整个市场的产能就是有限的。你自己造芯片,其实真正获得的并不是一颗“属于你自己的芯片”,而是对自身命运的掌控权。
这才是自研芯片最核心的卖点。
哈里 掌控自己的命运,意味着什么?
乔纳森 意味着英伟达不能再告诉你:“你这季度只能拿到多少块GPU。”你当然可能要付出更高的成本,因为自研芯片未必有英伟达的好。
我们再想想看,为什么英伟达的GPU能凭借比AMD稍微好一点的性能就彻底统治市场?
如果你部署整个系统的总成本是芯片本身价格的很多倍,那芯片哪怕只贵一点点,影响其实可以忽略。
举个例子:假设我要部署一台系统,芯片在整机BOM(物料清单)里只占20%,那即使芯片贵了20%,对整个系统的总成本影响也很小;但如果这颗芯片的性能提升了20%,那整台机器的价值就提升了20%。
所以你就会发现,只要芯片性能哪怕略有优势,整机的价值就大幅提升。哪怕是小幅性能差异,也会带来巨大的销售优势。
HBM供给瓶颈与数据中心摊销
哈里 你刚才提到了买方垄断。那在这种情况下,OpenAI、Anthropic,或者“七巨头”里的其他公司,还有可能真正进入芯片层吗?
乔纳森 如果HBM市场是买方垄断,那确实很难。但从HBM的供应商角度,他们还是有动力把资源分散给更多客户的。
英伟达因为采购量巨大,议价能力特别强,可以压低价格。假如你是HBM生产商,正在规划新的封装厂、整套供应链,那当英伟达带着大支票走进来,你当然优先服务他们。
所以,英伟达总能提前拿到他们想要的那部分产能。问题是,这张支票你必须提前两年以上开出来。
如今AI市场已经进入爆发式增长阶段,就算是英伟达、账上有充足现金,也很难提前两年把未来所有的需求都算清楚、签好单。
因此供给瓶颈是必然的。这不仅是因为市场结构偏向买方,更因为资本支出巨大,而HBM厂商普遍又很保守。
还有一点:HBM的利润率实在太高,高到让厂商根本不愿扩产,因为一旦产能增加,价格就会下滑。
哈里 完全明白了。但我想问,当我们看到OpenAI和Anthropic都在做自研芯片,这是不是也解释了他们为什么要融资?
比如萨姆(萨姆·奥特曼,Sam Altman)说他们未来可能需要几千亿美元,是不是这些都已经考虑进去了?
乔纳森 其实不是。真正烧钱,不是买芯片系统,而是建数据中心。
数据中心的成本更高,关键在于它的摊销周期更长。哪怕它只占你年度成本的三分之一,但如果芯片摊销期是三到五年,数据中心则可能拉到十年。从年化角度看,它反而更贵。
所以你看到那些科技巨头每年投750到1000亿美元,其实是在为未来十年甚至更长时间做准备,扩建数据中心产能。
这样看,这个数字也就不那么夸张了。
哈里 但如果芯片更新周期比三到五年还快,那我们现在用的摊销模型是不是也已经失效了?
乔纳森 没错。很多公司确实设定了过于乐观的摊销周期。
我们自己内部是按更保守的方式来计算的:五到六年是上限,很多时候我们更愿意按三年来算。
我们基本是按照“一年一代芯片”的节奏在规划。
你应该这样理解芯片的价值,它有两个阶段:一个是值不值得部署;另一个是值不值得持续运行。这其实是两套完全不同的经济模型。
部署的时候,你需要确保回收资本开支并有投资回报;但一旦部署完,只要这颗芯片跑出来的价值能覆盖电费和托管费,它就值得继续跑。
所以你可以接受芯片账面价值随时间递减,只要它还跑得动。
眼下大家在赌的一件事就是:下一代芯片出来之后,旧芯片的价值会不会低到连运营成本都覆盖不了。
在我看来,所谓“五年摊销”这个假设其实不太现实。因为到了第五年,新芯片性能已经大幅领先,旧芯片跑出来的价值可能已经撑不起它的电费和数据中心租金。
哈里 那到时候怎么办?会不会积压一堆跑不动的废芯片?
乔纳森 不一定。因为很多公司都签了长期合同,毁约成本也是一个要考虑的变量。有时候,“亏本运行”可能比“付毁约金”更划算。
哈里 我明白了。但真到了那一步,该怎么办?
乔纳森 那我也没法告诉你,因为我们正在尽全力避免出现那种情况。
所以我们在所有的模型里都在追求更快的投资回收期。我自己绝不会去赌一个太长周期的投资。你的下注周期越短,你的结果就越清晰可控。
更多算力就能得到更好的产品
哈里 所以本质上就是,尽可能缩短回本周期,同时尽可能降低运营成本,这样才能更快淘汰性能差的芯片?
乔纳森 没错。不过还有一个挺疯狂的点你可能没想到。
如果你用会计师的视角来算账,这套模型确实挺糟糕的,看起来根本不值得干。
但实证观察告诉我,人们现在还在租用H100芯片。这些芯片问世快五年了,但仍然运行得很好,而且赚的钱远远高于运行它的成本。你不会在今天部署一块新的H100,你会继续让它运行,因为它仍然有利可图。
哈里 它已经从部署阶段进入了维持阶段。
乔纳森 对。根本原因是,大家还是拿不到足够的算力。
如果不是这样,H100的租金早就跌成白菜价了。但只要算力供不应求,这种状况就会一直持续。
问题是:有没有什么替代方案,不那么受限于供给?
这就是我们希望能切入的地方。
我们再回到你刚开始问的“速度”问题。你知道有多少客户一开始找我们,是因为追求速度吗?
哈里 多少?
乔纳森 全部都是。但你知道他们中有多少人在了解了“市场供给现状”之后还继续问速度吗?
哈里 有吗?
乔纳森 一个都没有。
一开始大家都说:“我很在意速度,我知道这对终端客户意味着什么。”但接着他们就意识到:“等等,我连算力都买不到。”
所以真正的价值主张就变成了:你能不能提供足够的算力容量?
就在两周前,有个客户来找我们,说他们要5倍于现有系统的算力。他们找遍了所有超大规模云计算公司,一个都无法满足。我们也给不了,没有任何人能满足。因为整个市场就没有足够的算力。
所以你面对的选择是,我有这份算力,就能拿下这个客户。这就是你之前说的,如果OpenAI或Anthropic拿到双倍算力,就能拿到双倍收入。
如果你是一家连服务客户所需算力都不够的公司,那你一定愿意不惜一切代价去争取这个客户。因为你相信:先拿下客户,就能建立长期的锁定价值。
我们最大的卖点之一是:我们的供应链跟GPU的完全不一样。
你要订GPU,要提前两年写支票;但你要订我们系统,只需给我们打张一百万LPU(Groq 的推理芯片)订单的支票,六个月后就能开始交付。
哈里 六个月?这可比GPU快一年半!
乔纳森 没错,差距就是18个月。
我之前和某家超大规模云计算公司的基础设施主管开会。我谈了性能、成本什么的,他都还算平静。
但当我提到我们六个月交付能力时,他直接打断我,开始认真追问那件事。他唯一关心的,就是供应链。
哈里 换个角度想,现在模型迭代速度这么快,你觉得“两年交付周期”还有意义吗?
乔纳森 你听说过莎拉·胡克(Sara Hooker)吗?
哈里 没有。
乔纳森 她写过一篇论文,叫《硬件彩票》(The Hardware Lottery)。我用一句话概括那篇论文的核心意思就是:人们是在为硬件去设计模型。
所以理论上可能存在一些架构比attention更好,但attention在GPU上跑得特别好。
这就带来一个结果:如果你是现有的主导者,你天然占优势,因为大家都会围绕你的硬件来做模型设计。哪怕外面真有更好的架构,只要它在你的硬件上跑不起来,那它就不算更优。
这里面会形成一种小循环。
所以如果你是既有玩家,你按“两年之后”的节奏去规划,问题不大。但如果你是想进入市场的新玩家,没有人会提前两年就为你的芯片做适配。
你必须把迭代周期做得更快。
哈里 你刚才也提到OpenAI会做自己的芯片,Anthropic也是。那在这样的世界里,英伟达怎么办?客户还那么集中……
乔纳森 确实。没有人真正能预测AI的发展速度。
我们最开始不是就在讨论AI是不是泡沫吗?你看看过去十年数据中心基础设施的建设节奏,你得提前两、三、四甚至五年去规划,结果呢?
所有人的预测几乎都错了。大家总是建得太少。
这已经成了过去十年的规律。所以当你十年都建不够之后,你就会说:“那我这次要建多一点,要建超过我最乐观的预期。”然后,又捉襟见肘了。
于是你再次上调预期,又建,又不够……周而复始。
这就是现实。而且,大多数人还没有意识到的关键点是:AI并不是像SaaS(软件即服务)那样运作的。
在SaaS模式下,你有一批工程师构建产品,产品好不好,取决于他们怎么写的代码。
但AI不是。在AI模型里,我可以通过多跑几遍prompt来挑选更好的答案,直接提升产品质量。
我还可以为每一个prompt多花点钱,让模型跑得更好。我甚至可以根据用户的价值决定——这个客户重要,我就给他更高质量的结果。
OpenAI前几天就公开了一个类似的策略:他们会推出一些产品,这些产品的运行成本非常高,所以只会开放给少数用户,同时价格也会更高。他们想看看,当模型获得更多算力后,产品能变得多好。
这,就是未来方向。
只要你为应用分配更多算力,产品质量就会上升。这就是为什么你会发现,很多AI公司“token-as-a-service”支出几乎等于收入。因为他们花得越多,产品就越好,客户就越多。
美国模型优势来自于压倒性的算力优势
哈里 完全理解这一点。但我想直白一点问你:我们看到GPT-5在追求效率,有很多人说萨姆已经从“性能优先”转向了“效率优先”,因为算力投入并不会线性带来性能回报。
你觉得这个说法对吗?会不会和你刚才讲的观点相矛盾?
乔纳森 我不觉得矛盾。你要分清楚他们追求的结果不同。
比如OpenAI现在进入的是一些极度敏感的价格市场,就拿印度举例来说吧,如果你想在印度赢得市场,有一个核心指标是什么?
每月订阅费必须控制在99卢比左右,大概是1.13美元。你必须把服务控制在每月一美元出头的价格,才能服务那些“否则就用不了AI”的用户。
哈里 那印度用户也可以选DeepSeek这种?
乔纳森 这正是市场上的另一个误解。我们可以来拆几个误区。
哈里 好啊,我喜欢拆误区。
乔纳森 比如中国的一些开源模型发布时,大家的第一反应是:“天哪,他们训练出了几乎和美国一样好的模型!”
我们当时还专门聊过这事,录了一期播客。说实话,我一开始也有点被带节奏了。但很多人没看到的是:这些模型真的更便宜吗?它们真的更适合实际部署吗?
现在我对主流基础模型和中国模型了解更多以后,我可以肯定地说:中国的模型运行成本并不低,实际上要贵大概10倍。
我们就拿最近发布的OpenAI的GPT-OSS模型来说吧。它优化的目标跟中国模型不一样,但质量非常高。我甚至会认为:就它所专注的那个方向而言,它显然比中国模型更好。当然,中国模型也各自有不同侧重点。
但关键是,跑这个OSS模型的成本,大概只有中国模型的十分之一。
那为什么当时大家会觉得中国模型更便宜?其实是被价格误导了。很多时候,一个模型一旦成了“市场唯一选项”,大家都指定要用它,而提供方也只有一个,那它自然可以把价格抬上去。价格高了,大家就误以为成本也高。
实际上,中国模型的优化重点是在训练阶段更省钱,而不是推理阶段更高效。但如果你把OSS模型和中国模型在推理环节的效率拉出来对比,就会发现一个很明显的事实:美国在训练上的强度和密度,依然远远领先。
这在经济上也说得通。训练一个模型花出去的钱,最后是要靠每一次推理(inference)去“摊平”的。那怎么摊得快?就得让每次推理便宜。
怎么做到这一点?那你在训练阶段就得花更多资源,把模型压得更紧凑、更高效。
而这一点上,美国的优势特别明显——我们拥有压倒性的算力优势。我们可以用更强的计算资源把模型训练得更彻底,最终换来的是:推理更快、成本更低。
哈里 我们为什么能有这样的算力优势?就因为我们能拿到芯片吗?
乔纳森 对,就这么简单。
哈里 那中国就不能靠补贴,把推理这部分“烧钱顶住”?我理解他们现在确实在补贴啊。虽然运行成本高一点,但靠砸钱也能扛下来吧?
乔纳森 这就要分清“主场”和“客场”的区别了。
所谓主场,指的是我们自己,为美国本土建设足够的算力;客场,则是一些盟友,比如欧洲、韩国、日本、印度等等——我们希望也为他们提供算力支持。
在主场,中国当然可以下重注。他们计划建150座核电站,虽然芯片能效没那么高,但电力够多,再加上政府补贴,确实能把运行成本压下来。
但到客场,局面就不一样了。你想,一个国家如果只有100兆瓦电力,能轻易说建就建一个核电站吗?显然不行。这是中国能做、但别的国家没法做的事。
所以,谁能提供更节能的芯片,谁就能在客场取得压倒性优势。
我的判断是:未来两到三年,美国在AI的客场战役上,会明显领先中国。
如果我们动作够快,就能带上一批盟友共同进入AI竞赛的正轨。
哈里 那你觉得我们应该开源模型吗?毕竟中国在模型这方面的能力已经很强了。
乔纳森 我觉得模型本身不一定是决定性的优势。
你还记得你第一次请我上节目的时候吗?我当时就预测,OpenAI会开源他们的模型。
哈里 记得,你当时确实这么说了。
乔纳森 我之所以这么判断,其实主要是基于OpenAI的品牌力。
说句实话,就算他们只是拿两年前Meta发布的LLaMA 2模型,贴上自己的牌子,很多人还是会用。这就是品牌的影响力。
当然,他们现在的模型本身也确实非常强,但就算哪天性能不领先了,大家还是愿意用他们的模型。
我认为,Anthropic应该开源自己上一代的模型,目的不是为了比拼SOTA,而是给用户一个替代中国模型的选项。
因为那些愿意用中国模型的人,至少也可以选择用Anthropic的开源模型。这会带来几个好处:
第一,prompt是可以复用的,就像软件之间的兼容性一样;
第二,用户一开始用了Anthropic的模型,后面要转向他们的商业模型,迁移成本就很低。而用中国模型,往往prompt结构都不一样,没法兼容,切换难度更大。
就像当OpenAI发布OSS模型时,很多人开始采用它,原因之一就是,原来写的prompt可以直接用,不用重写。
当然,如果你是低成本应用,暂时还承担不起OpenAI的付费模型,那你可能会从开源模型开始。但只要你业务做起来、有了收入,自然就想上更好的模型。
这时候,prompt的兼容性就成了巨大的优势。
除此之外,开源模型还有一个附加好处:它能带动整个基础设施生态围绕它优化,把运行成本进一步压低。
这种生态层面的正反馈,会催生大量创新。
没有能源,就没有算力
哈里 我们刚才聊到的主题是:要尽可能建设更多的算力。但你也知道,这对能源的需求是巨大的。那我想请教一个直接的问题:支撑这场算力浪潮或者说是算力海啸,唯一可行的能源解决方案,是不是核能?
乔纳森 不是。核能确实高效、成本也合适;但可再生能源同样高效,也能控制成本。
我给你一个很简单的思路:只要美国的盟友愿意把算力部署在能源便宜的地方,他们其实可以获得比中国更多的能源资源。
我们就以美国和欧洲作比较:美国整体上,其实是个更“怕犯错”的国家。
哈里 你说的“怕犯错”,是指在能源领域吗?还是泛指?
乔纳森 泛指,美国在很多事情上都更谨慎。
但我们要区分两种“犯错”方式:一种是做错事;另一种是错过机会。
美国特别害怕“错过机会”。在一个高速增长的行业里,“没做”造成的损失,往往比“做错”还严重。
而欧洲则相反,他们更倾向于接受“错过”的风险。
你看他们现在参与AI竞赛的方式,是通过立法来设定边界,比如要求“数据必须存在本国”、“必须留在欧洲”等等。
但其实,如果欧洲真想参与这场AI竞赛,只需要做一件事:让挪威全力发展风能。
为什么是挪威?因为他们的风电可用率接近80%。也就是说,一年里有80%的时间都在稳定发电。
再加上他们已经有庞大的水电基础,如果他们把风电规模扩大到现有水电的5倍,光是挪威一个国家,就能发出相当于整个美国的电力,而且是稳定、绿色的。
哈里 你的意思是……挪威一个国家,就能撑起整个美国的用电需求?
乔纳森 对,完全可以。
这也说明我们还浪费了多少潜在的、非核能的清洁能源资源。当然,我也支持发展核能。现代核电技术已经非常安全。
哈里 那我们为什么不大规模上核能?就只是因为大家害怕吗?
乔纳森 基本就是出于恐惧。
哈里 那你和欧洲政府聊这些能源话题时,他们是怎么回应的?
乔纳森 我一般不会主动谈核能。因为这是一个一开口就会被广泛反对的议题,我不想一开始就引发政治阻力。
但我最近在日本,他们正在认真讨论重启核电。外界常觉得日本做事慢,其实这是因为不了解细节。日本确实在“决策阶段”很慢,但一旦做出决策,执行非常快。
比如他们决定要建一座2纳米晶圆厂,我上次去时,他们已经开始展示他们做出来的2纳米晶圆了。
当然,目前良率还不够量产,但厂房已经建成,产品也做出来了,只差继续提升良率。
他们还承诺将投入650亿美元发展AI,行动非常迅速。
而且他们也会重启核电。
哈里 哇,如果连日本都重启核能,那欧洲可真的该紧张了。
乔纳森 没错,他们现在得开始追赶了,对吧?
哈里 不过我刚才一直在想你说的“挪威风能”。问题是,想建出那么多风电设备,起码也得几年时间吧?你觉得挪威政府真会出钱,在海岸线上造一万个风机?
乔纳森 那为什么一定要是挪威政府出钱呢?
哈里 那还能谁出?
乔纳森 比如科技巨头们可以出;或者那些希望在欧洲部署AI的国家,也完全可以出。
你看看沙特,他们有大量千兆瓦级别的备用电力资源,还正在围绕这些电力建设新一代数据中心。
那欧洲为什么不和沙特合作?
沙特现在正在推进一个计划,叫“数据大使馆(data embassies)”:数据依然属于原主权国家,但可以利用沙特的能源运行。为什么不合作呢?这样问题就能解决。
我预计他们很快就会建成3到4吉瓦的发电能力。
所以未来很可能的路径是:科技巨头出资,租用挪威或沙特的清洁能源,再基于这些能源部署大规模算力。
哈里 但这些巨头总是在抱怨,说行政审批太慢、流程太复杂。
乔纳森 我之前和一个大型能源公司的董事聊过,他们是建核电站的。他说在美国,用于审批流程的费用是核电站本身建设成本的三倍。
我不清楚欧洲的情况,但通常来说,美国在这方面还比欧洲快一点。
哈里 在欧洲建一座核电站,到底花钱最多的,是工程本身,还是冗长的审批流程?
乔纳森 我觉得大家真正要记住的是这句话:谁掌握算力,谁就掌握AI;而没有能源,就没有算力。
哈里 那我们再回到欧洲本身——你怎么看现在的局势?欧洲到底落后多少?还有追赶的希望吗?我不是想唱衰,但我们真的还有机会翻盘吗?
乔纳森 我不觉得欧洲已经错失良机。只要现在开始行动,一切还来得及。
中国确实在执行效率上更快一些,但别忘了:欧洲有5亿人口,美国有3亿多,再加上所有盟友,比如韩国,他们有建核电站的成熟经验,阿联酋的核电站就是韩国承建的。
所以我们为什么不能搞一个“能源版的曼哈顿计划”呢?
我今年夏天走了很多欧洲国家,夏天热得惊人,冬天又冷得刺骨。
这种极端的气候体验,几乎全球其他地区都没有。那为什么不借此机会加速能源基础设施建设?
哈里 我非常同意你的判断。但现实是,无论是单一政府,还是跨国协调,政策落地的速度永远赶不上AI的发展。
如果我们无法以匹配AI的速度推进能源计划,会发生什么?
乔纳森 那欧洲未来的经济结构,可能就会退化成“观光经济”,人们来看看老建筑、拍拍照,仅此而已。
如果你没有支撑新一代经济所需的基础资源,就注定无法参与未来。
而这个未来,就是建立在算力基础上的AI经济。
哈里 那“模型主权”够不够?比如欧洲自己训练模型,是否就能掌握主动权?
乔纳森 远远不够。如果你没有足够的算力,模型根本跑不起来。性能再好也没用。
你就算训练出一个比OpenAI强10倍的模型,但只要OpenAI有你10倍的算力,他们在真实世界的表现就一定更好。
哈里 但像Misra这样的公司不是正在推进“欧洲模型主权”吗?他们说:“德国医保系统、克罗地亚交通部用的是我们的模型,因为我们不是美国公司。”
乔纳森 这其实不构成真正的护城河。你得问:它的独特价值是什么?
“我们是欧洲公司,不受美国管辖”——这听上去挺有说服力,尤其在某些政治场合。但这跟“你有没有足够算力”没有任何关系。
它解决的是“别人不能控制我”,但没解决“我有没有能力干成事”。
当然,我不是在否定Misra,我们也跟他们有合作,我个人也很欣赏他们。
我想强调的是:你得有基础设施,才有真正竞争力。没有足够的算力,任何模型都只是空谈。
算力是AI供应链中,最可预测、最确定的环节
哈里 听你说到这,我都想立刻去买CoreWeave的股票了(笑)。他们现在做的按需算力听起来简直太理想了。
乔纳森 CoreWeave确实是非常优秀的公司,但他们的GPU配额也很紧张。现在每家都有配额问题。
哈里 你之前跟我说过,其实GPU也不是最理想的推理基础设施,对吗?
乔纳森 对。随着训练逐渐趋于成熟,AI正在步入一个“推理为主导”的阶段。
哈里 那是不是意味着英伟达的主导地位会被削弱?
乔纳森 不会。英伟达会卖掉它能生产出的每一块GPU。
就算我们最终部署的LPU数量是GPU的十倍,也只会让市场对GPU的需求更强,英伟达还能卖得更贵。
哈里 这听起来有点反直觉,为什么会这样?
乔纳森 因为你部署得越多,就需要训练得越充分来支撑推理效果;你训练得越多,又要部署更多推理能力来摊薄训练成本。
两者是正向循环。
哈里 那你觉得现在推理市场的发展,是否符合你当初的预测?比如成熟度、部署速度?
乔纳森 完全出乎我预料的一点是,AI居然是基于语言的。
这使得人们可以用最简单的方式与AI交互。我原本以为它会像AlphaGo那样,是种很怪异的智能系统。
结果它是语言。意味着任何人都能用它。
我当初的预测是:AI会更早出现,但增速会很慢。但实际情况是:AI来得晚一点,但增速远超我的预期。
它的交互门槛实在太低了,现在全球差不多有10%的人每周在用ChatGPT。这太惊人了。
哈里 确实。那你知道目前限制它进一步普及的主要障碍是什么吗?
乔纳森 是算力。
算力限制了AI的质量。但更现实的问题是:就算质量没那么完美,只要能支持更多语言,就会有更多人愿意使用。
哈里 这也是我们在全球市场上听到最多的用户抱怨之一。
乔纳森 那怎么解决?就两个字:堆算力。
你有更多算力,就能处理更多数据;你有更多数据,就能训练得更充分。
甚至你可以生成合成数据(synthetic data),这也是推动训练的重要资源。
AI的三大核心要素:数据、算法、算力。这三者只要有任何一个提升,整体能力就会上升。
它们之间没有“硬瓶颈”,不是说你算法不变,就不能多用数据;也不是说数据不变,就没法多上算力。只要有一个进步,AI就能变强。
也正因如此,AI的发展路径其实并不复杂。只要你在某一维度持续投入,整体就会推进。
而在这三者中,最容易提升的,就是算力。
算法进步缓慢;优质数据难以收集,合成数据仍有不确定性。
但算力不同。你只需要开出一张足够大的支票,等上一段时间,你就能拿到更多。
算力是AI供应链中,最可预测、最确定的那个环节。
哈里 但就算我们已经意识到算力的重要性,其实大家还是大大低估了真正所需的规模,对吗?
乔纳森 完全正确,低估得非常严重。
哈里 你觉得这种低估有多夸张?
乔纳森 还是那句话:每次你给模型增加算力,它的表现都会变好。这意味着,我们对所需算力的低估,是没有上限的。
这和工业革命是两回事。
在工业时代,光有能源还不够,你还得制造机器,而造机器是需要时间的。比如你想让街上多跑点车,不是把石油抽出来就够了——你还得先把车造出来。
但AI不一样。
虽然你也可以通过算法优化,提升效率,但最直接的办法就是堆算力。你把算力翻倍,就能支持更多用户,提升模型质量,拓展AI应用的边界。
我们从没遇到过这种情况,不是瓶颈问题,而是一个“加一块就变更好”的系统。每多塞进去一点算力,AI整体表现就上一个台阶。
未来会出现一个“劳动力荒”
哈里 你之前提到AI能增强经济体,这是不是建立在一个假设上:就是未来全球GDP中,用于人力的10万亿美元支出,会有一部分逐渐转向AI?你觉得在接下来的五年,这种结构性转移真的会发生吗?
乔纳森 我认为未来会出现一个“劳动力荒”。不是AI抢走大家的工作,而是我们的人手不够,去填AI带来的新岗位。
接下来会有三个变化:第一,是强烈的通缩压力。你这杯咖啡、你的房租,几乎所有东西都在变便宜。
哈里 等等,为什么连咖啡也会更便宜?
乔纳森 因为AI和自动化会全面提升效率:咖啡种植会交给机器人;供应链调度由AI管理;连咖啡本身都能用基因工程优化,让产量更高。
从种植到运输再到销售,每一个环节都变得更高效,成本自然下降。
所以我们将迎来一轮系统性的通缩,生活成本降低,维持生活的支出变少。
第二,人们会逐步退出劳动力市场。
大家会选择少工作、甚至提前退休。因为生活成本更低了,工作动机自然下降。
第三,是全新的岗位和产业将被创造出来。
你想想一百年前,美国98%的人都在干农活。等到农业只剩2%的劳动力时,剩下那98%的人干什么去了?他们并没有失业,而是进入了那些当年根本不存在的新行业。
未来也一样:“软件工程师”这个职业,100年前没人听过;“网红”这种岗位,以前根本没人能理解。将来我们也许会看到“直觉编程(vibe coding)”成为新的基本技能,人人都会一点。
所以结论是这样的:通缩压低生活成本;大量人选择减少工作甚至退出工作;与此同时,全新岗位与公司大量涌现,反而人手不够。
哈里 这真是完全反主流叙事。现在大家都在担心AI会让几百万人失业,而你反过来说:我们反而缺人来填新岗位。
乔纳森 没错,这就像过去人们曾担心全球会大规模饥荒,结果我们生产力提高了,人类反而过剩。
人们总是低估技术变革对经济结构的影响。
哈里 说到变革,你怎么看特朗普及其团队对美国AI发展的影响?是加速器还是障碍?
乔纳森 整体上是加速器。他们在一些制度层面确实做了简化,比如审批流程。从政策角度看,他们对AI的态度是积极的。
哈里 你刚刚提vibe coding,我得追问一下。你觉得这会成为一个长期趋势吗?很多人觉得这类新工具只是过渡产品,你怎么看?
乔纳森 我觉得vibe coding的发展路径就像读写能力。
早年只有一小部分人识字,识字的人就能当抄写员,这是个技能型职业,待遇也很好。
编程现在也是同样的处境。
但将来,每个人都会读写代码,不是为了当程序员,而是因为这变成了所有行业的基本能力。
做市场的人需要写自动化脚本;做客服的人也可能需要处理系统逻辑。
我有个朋友开了25家咖啡店,从没写过一行代码。他用vibe coding做了一个简单的库存系统,能看每家店的存货情况。
一行代码没写,全是靠自然语言生成的。
后来他开始遇到各种小bug,“这个按钮点不了”、“那个页面卡住了”……完全是我们工程师日常处理的场景。
他也开始自己修这些问题,用的还是vibe coding。
这才是真正的趋势:人人会一点点写代码,它像读写能力一样融入生活。
为何力求保持低利润率
哈里 在这样一个指数级增长的世界里,我想问个现实问题,保持低利润的策略有意义吗?比如你们自己开发的AI平台,毛利其实并不高。那低利润是不是一种劣势?
乔纳森 我是这么来看的:利润的真正意义,是给你抗波动的缓冲垫。
如果你利润率很低,一遇到融资困难或市场波动,你就可能扛不住。下一轮钱可能融不到;银行可能不愿意放贷。
但有利润,你就有实力留在牌桌上。
当然,利润高也意味着容易引来竞争者。有句老话说得好:“你的利润,就是我的机会。”
所以这始终是一种权衡:你要在“稳定性”和“护城河”之间做选择。
哈里 那你们公司内部是怎么思考利润空间的?
乔纳森 我认为公司必须有利润空间,但这份空间,应该优先回馈给客户。
你得有灵活性,能让也能收。这样在市场上你才会处于有利位置。
我曾经面试一位CFO候选人,虽然最终我们请的是另一位,但那位候选人说了一句很有意思的话:我们可以用提价来降低需求。
哈里 听上去挺合理,从经济学角度也说得通。
乔纳森 对,逻辑上讲得通。
但我反问:那我们是不是也可以滥用品牌信任?是不是也可以用客户对我们的信任,去卖他们并不需要的东西?
品牌价值是有价值的。你应该让品牌信任度维持在尽可能高的水平。
因为信任是有复利效应的。
同样的道理,我认为利润率也应该低到一个水平,让客户觉得你始终在给他们一个好价格。如果你赚得太狠,你就是在和客户对立。
我希望我们的利润率是在不影响公司稳定运营的前提下,尽可能低的。
我的现金流来自哪里?来自销量的增加。而我喜欢算力这个生意的原因是:算力的需求是无止境的。
这就是Jevons悖论(这个悖论由英国经济学家威廉·斯坦利·杰文斯在1865年提出。他观察到:随着蒸汽机效率的提升,单位煤炭可以做更多的工作,人们预期煤炭使用会减少,但实际上,煤炭的总消费量反而增加了。):你每多生产10倍的算力,就能卖出10倍的量。
只要我们持续降低成本,用户就会买更多。
所以我的目标是持续压低成本、提升销售量、让用户以更低的价格获取更多价值,从而继续买更多。这个飞轮会一直转下去。
哈里 那我们现在这个成本压降的过程走到哪一步了?
我还记得我们早期节目的时候,我会问一些问题,现在回头看真有点想笑,比如我会担心Canva推AI后利润率会不会被拖低?结果现在一看,AI实施成本已经下降了98%!
你觉得我们这轮成本下降的周期,现在处在哪个阶段?
乔纳森 我们先往后退一步,还是用你刚才说的Canva做例子。
真正成功的公司,不是盯着利润表看,而是盯着客户。他们在做的,是解决客户遇到的问题。
如果你总是在比价格,那你就输定了。你真正该做的是差异化,去解决客户还没能解决、其他人也解决不了的问题。
客户很乐意为此付费。
如果你只看利润表,好像这笔AI开支不合理;但如果客户通过这项AI服务解决了一个本来解决不了的问题,那就完全合理。
而且通常来说,AI还能带来一个额外好处,即扩大市场规模。比如你两年前用Photoshop,很难用;现在你只需要给个prompt,就能生成图片。
门槛降低了,市场规模自然扩大。你可能单张图片收的费用更低了,但总收入反而提升了,因为你服务了更多人。
AI领域的人才大战进入史上最疯狂
哈里 让我问个金融问题。现在标普500都快要冲到7000点了,“美股七巨头”一路狂飙,我们已经很久没见过这么集中、这么结构性的上涨行情。可听你讲AI,又感觉这才只是开始而已。
那我该怎么理解这两种看上去矛盾的情绪?一边是市场像要见顶了,一边是AI的潜力看起来无限?
乔纳森 价值这件事,有两个维度:一个是称重,一个是选美。
有些资产就是纯选美,比如加密货币。我从来没买过比特币。我为啥错过了?因为我不擅长玩“选美”。我不知道什么会火,什么不会火。对我来说,玩不转的。
我唯一能做的,就是看得见价值。
而当我看向AI,我看到的是真正的、被兑现的价值。
最好的例子是,私募股权(PE)公司现在蜂拥而至。他们想获得低成本的AI算力,因为只要他们能拿到更多便宜的算力,就能直接改变他们被投企业的利润底线。
这是实打实的价值。当PE公司开始抢某样东西时,那绝对不是选美比赛,那是价值驱动。
公司之所以会获得高估值,有两种原因:一种是市场认定,这家公司未来能兑现价值;另一种是它陷入了炒作循环,变成了纯粹的“选美比赛”。
市场上的参与者也不一样,有的人只玩人气投票,有的人真的在看基本面。他们也许会得出相同的投资结论,但出发点完全不同。
如果从价值的角度来看,或者说从“长期称重机”的角度来看,经济中最有价值的,其实是劳动力。而现在,通过提供更强的算力和更好的AI,我们实际上能够向整个经济体系里注入更多“额外劳动力”。
这种事情,在人类经济史上从未发生过。
哈里 你会不会担心,在短期内如果我们遇到一点波折,鉴于当下价值如此高度集中,会不会使经济的很大一部分被脱轨?
现在大家都在狂飙上涨,但如果英伟达、Meta、谷歌、微软这些公司突然遇到“减速带”,AI这列高速列车慢下来了,那它的乘数效应就会非常惊人。你担心吗?
乔纳森 我确实会担心。但这不是因为AI本身没有价值,而是因为,这是系统过热之后的自然反应。
你可以把市场想象成一个系统,它本来可以沿着健康轨道增长,但也可能因为过热而失控。
一旦过热,人们就会不断加码,直到某个时刻突然意识到“撑不住了”,然后整个市场迅速回调,甚至跌破合理区间。
在这个过程中,很多原本不错的公司,可能因为信心崩盘、融资断裂而倒下。
但我们也知道,每一次市场调整之后,都会出现一批真正优秀的新公司。
哈里 那你觉得未来一年会不会出现这种回调?
乔纳森 这我真的没法预测。
因为预测的前提是:预测本身不能改变结果。但在经济系统里,很多时候预测本身就会引发反馈,那它就不再具备可预测性了。
比如一颗小行星正朝地球飞来——如果我们无力阻止,那就能准确预测它会撞上来。
但如果我们能预测,并因此研发出拦截手段,那预测本身就改变了结局。
你明白问题出在哪了吗?
哈里 懂了。
乔纳森 在经济系统中,你甚至不需要改变“实际的东西”,只要资金流动的方向变了,系统就会剧烈波动。
正因为这些反馈机制太敏感,所以经济走势很难预测。
我没法告诉你明年经济会怎样。我唯一能说的,是我现在在AI领域看到的最大问题:
如果你发现一个优秀的工程师,就算你愿意雇他,他可能也不会加入你,因为他可以自己出去融到10万、2000万,甚至1亿美元。
他会怎么做?当然是去自己创业。
这就导致我们很难在一家初创公司里聚拢关键人才。
但从另一个角度看,AI本身也在提升小团队的效率,哪怕人才被分散了,事儿照样能做成。
哈里 你觉得现在的市场,是不是已经有点过热了?
乔纳森 判断市场是否过热,有一个很简单的指标:这个经济系统有没有在阻碍公司取得成功?如果没有,那我不觉得它过热。
哈里 但你看,现在资本太充足了,反而让你们这些公司招不到好人。很多人拿到钱后,不愿意加入Groq,而是自己出去创业……
乔纳森 对啊,所以我现在都得说:“拜托你们,别再这样了(笑)。”
不过话说回来,AI确实让每个人都变得更高效了。
所以也许,即使经济还在高歌猛进,各家公司依然能持续成功。
谁知道呢?我们从没经历过这样的时代。
哈里 那现在的人才大战,是不是已经疯狂了?
乔纳森 绝对是。这是有史以来最激烈的一次,但只发生在科技行业。
OpenAI和谷歌进入“双雄争霸”
哈里 我们看看体育行业,其实它一直都挺疯狂的,尤其这几年更甚。
你回头看二三十年前,顶级运动员的薪资,也就和现在的科技从业者差不多。只不过,人们逐渐意识到,真正有价值的是那些顶尖人才。
但体育行业有很多限制:球队数量有限,还有工资帽。科技行业完全不一样,这里没有上限。你可以有无限支“球队”、无限家初创公司。
你想想,如果谁都能组建自己的橄榄球队,那球员的薪资会涨到什么程度?整个联赛的估值又会变成什么样?
那现在有没有哪家公司让你印象最深?又有没有哪家让你感到担忧?
乔纳森 我觉得变化最显著的是谷歌。
谷歌长期有一个结构性优势:公司文化允许工程师自由提出好点子,而管理层的职责就是别挡路。
这其实是一种很强的系统性优势。
哈里 你觉得Gemini算是他们的一次成功吗?
乔纳森 算的。光看用户使用量就很不错了。
哈里 那你怎么看Gemini在消费级产品里的整合?
乔纳森 老实说,还不够好。它虽然被整合进了Gmail,但基本没什么人能真正用上。它也出现在其他产品里,但感觉就像是仓促塞进去的,整体体验还不成熟。
不过现在还不能下结论,至少他们正在通过这些入口收集用户数据,这对未来产品方向会很有帮助。
这让我想起当年的Google TV,一开始是个彻底的失败,但他们不断迭代,最终变成了Google Chrome。
这是一条典型的产品路径:公司先推出一个半成品,挨骂,忍住,然后不断优化,最后做出真正出色的产品。
哈里 但前提是你得有分发渠道的优势,才能扛得住那些批评。而现在,OpenAI已经把这种先发优势大大缩小了。
乔纳森 确实如此。谷歌可能确实慢了一步。这其实就是一个经典问题:大公司能否在初创公司掌握分发之前完成创新?
现在的现实是,初创公司已经抢下了分发权。OpenAI的产品被全球10%的人口在使用,这太惊人了。你现在很难想象OpenAI会突然消失,我觉得基本不可能。
哈里 所以我们现在进入了“双雄争霸”阶段?
乔纳森 没错,就是OpenAI和谷歌。Anthropic其实做的是另一件事。
哈里 你是说,Anthropic更专注于代码生成,而OpenAI和谷歌都聚焦在聊天机器人?
乔纳森 OpenAI做聊天机器人,谷歌也做;谷歌做代码生成,OpenAI同样在做。
哈里 那你们团队现在最常用哪个工具?
乔纳森 最近,工程师更偏向用Codex,而不是Anthropic的工具。
哈里 哇哦。
乔纳森 而且这个偏好几乎是按月在变。
我们的原则是:不规定用哪个工具,但有一条铁律——必须用AI。
不用AI,你根本没有竞争力。
我们看到他们之前用Sourcegraph,后来用Enro,现在转到Codex,下个月可能又切回Sourcegraph。
哈里 那在这么频繁切换的情况下,这些工具还有持久价值吗?
乔纳森 我们那批工程师都是一线的。哪个工具好,他们就马上切过去。
当然不是所有人都这样,但我们这个圈子里很多人确实是。
但企业客户不一样。他们签的是一年、甚至更久的合同,一般不会轻易更换工具。
OpenAI和Anthropic都被严重低估了
哈里 那如果现在让你选:OpenAI估值5000亿,Anthropic1800亿,你投哪家?
乔纳森 我两个都投。
哈里 你会?!
乔纳森 当然。它们都被严重低估了。
很多人还把它们当成是在一个有限市场中抢份额的竞争者。但实际上,他们做的事,是在不断把这个市场的上限抬高。
哈里 那我们顺着这个牛市逻辑往下推:这两家公司能走多远?
乔纳森 我觉得现在的科技巨头还能继续涨很多。
但为什么AI实验室不能追上来?“七巨头”会涨,AI实验室也能追上,这两件事并不矛盾。
真正的问题是:AI实验室最终会不会超过“七巨头”?
(聪投注:像OpenAI前首席科学家、联合创始人伊利亚·苏茨克维尔(Ilya Sutskever)2024另起炉灶,就是和团队创办了一个新的AI实验室Safe Superintelligence(简称 SSI)。它的目标很硬核:不急着做产品和商业化,而是做更强的模型+更安全的对齐,走的是典型的“顶级研究团队先建底座”的路线。)
哈里 你觉得决定因素是什么?
乔纳森 我不知道。但说真的,我觉得他们最终可能会融合出新的Mag Nine(九巨头)。
哈里 那可能就不止是Mag 9,而是Mag 11、Mag 20了。你觉得AI实验室未来会不会涉足应用层,把这一层也一并拿下?
乔纳森 这是所有成功科技公司的自然路径。它们开始做客户原本在做的事,不断上探技术栈,把客户的业务一口吞掉。
然后又会有新一代创业者在它们头上继续搭建新层。
比如OpenAI。你们节目里萨姆·奥尔特曼就说过一句话:如果你只是在OpenAI上做一点小修小补的产品,你很快会被淘汰。他只是在诚实地说出一个事实。
而我们这边,选择了一条不同的路:我们不做模型本身,不训练自己的大模型。
这就像在地上画了一条线:你可以放心在我们这层基础设施上构建,因为我们不会和你竞争。
当然,也可能我们错了。也许哪天我们会被自己的客户反向吞并。
但这也意味着,你可以信任我们不会动你的奶酪。
哈里 但这听上去也是个挺花钱的决定。你要自己训练模型,那得烧多少钱啊?
乔纳森 非常烧钱。
哈里 说到钱,你们最近不是刚融资吗?
乔纳森 我们刚融了7.5亿美元,估值差不多是70亿美元。
哈里 太厉害了,恭喜!但说真的,够用吗?
乔纳森 其实我们原本只打算融3亿。
你刚才也提到盈利的问题。对我们这类做硬件的公司来说,其实还好。和做模型的公司不同,我们卖硬件是可以盈利的。
哈里 我还以为你们的硬件是亏本卖的?
乔纳森 不,我们卖硬件是赚钱的。
软件就要看情况了。有些模型在我们芯片上跑是赚钱的,有些能覆盖运营成本但资本开支回报不够,我们对资本支出是很谨慎的。
卖硬件我们肯定是赚钱的。哪怕是那些利润最薄的模型,只要我们芯片寿命够长,依然有望盈利。现在我们只是还不知道这些芯片能撑多久。
哈里 那长期来看,你们的毛利率走势如何?未来利润率会不会越来越高?
乔纳森 这就是我们作为一家私营公司的小优势之一,我可以选择不告诉你。(笑)
哈里 但你要是愿意说,那就太好了(笑)。
乔纳森 我们能保留的好处也就剩这点了!
哈里 确实,你们没有锁仓期,退出也更灵活。
乔纳森 但我从来没卖过一股。真的,从来没有。
哈里 那你可真不懂游戏规则。(笑)回到利润率本身,你们是怎么看的?
乔纳森 我还是坚持之前的观点:只要业务不出现剧烈波动,我希望我们的利润率越低越好。
利润率的意义在于缓冲不确定性,当你需要资金时可以适当涨价,带来现金流;但平时,价格应该尽量压低。
现在对算力的需求极高。如果某个客户非常着急,我们可以对他小幅提价,从而维持其他客户的低价。
英伟达市值肯定会冲上10万亿美元
哈里 那你能预测一下五年后的芯片格局吗?
乔纳森 我认为五年后,英伟达的营收份额仍会超过50%,但它的出货量可能不到市场的一半。
哈里 你是说,它能拿到一半以上的收入,但只卖出了不到一半的芯片?
乔纳森 对。品牌本身就值钱,能支撑更高的售价。但这也意味着它会“失去饥饿感”,利润率很高,客户还是会买——因为买英伟达的产品,不容易出错,不会被炒掉。
这是个好生意,依旧有价值。如果你投资英伟达,大概率不会错。
哈里 但从客户的角度看,现在这个市场的集中度非常高——也就三十来家公司,就占了90%、甚至99%的采购支出。对他们来说,决策时绝不会只看品牌,而是要看哪种产品真正能提升自己的业务表现。所以,未来一定会有越来越多不同芯片加入竞争,因为这些大客户本身就拥有很强的议价能力。
你刚才说“投资英伟达基本不会错”,那你怎么看,五年后英伟达有没有可能冲到10万亿美元市值?
乔纳森 如果五年后它还没到,我会很惊讶。不过真正该问的是:Groq能不能做到十万亿?
哈里 你觉得有可能吗?
乔纳森 当然有。我们不像英伟达那样受限于供应链,现在我们是全世界最有能力扩产算力的公司。
而算力,正是这个时代最稀缺的资源。所有人都在高价抢算力,而我们可以几乎无限地供给它。
哈里 那你觉得市场还没理解Groq哪些价值?
乔纳森 这得看是哪一个月。(笑)
比如“多用户能力”这块,大家原以为我们做不到,结果我们展示了可以在同一块芯片上并行支持多个用户。
哈里 这是因为你们用SRAM架构?
乔纳森 没错。但你知道我被问得最多的问题是什么吗?“SRAM不比DRAM贵多了吗?”
答案是,确实贵。
粗略说,SRAM每bit的成本大概是DRAM的3到4倍。这还是单就结构说的,不算其他开销。
哈里 能简单说说这两者的区别吗?
乔纳森 打个不严谨的比方说,SRAM是芯片内部的内存,DRAM是外部内存。
设计上,SRAM要用6~8个晶体管,DRAM只用1个电容+1个晶体管,所以SRAM占的硅面积更大,自然也更贵。我们还是在3纳米制程上部署SRAM,成本更高。
综合下来,SRAM每bit成本可能是DRAM的10倍。
但我们真正关注的,是系统层面的总成本。
比如我们跑Kimi模型,是在4000块Groq芯片上部署的,而别人用8块GPU。这意味着我们只需要保留一份模型副本,而GPU系统得保留500份,消耗的是500倍的内存。
所以虽然SRAM贵,但DRAM花的钱可能更多。这就是典型的“别只看芯片单价,要看整个系统效率”。
现在我们已经从系统层面优化,拓展到全球层面了。
我们在全球有13个数据中心,覆盖美国、加拿大、欧洲、中东。我们会根据不同区域的输入输出特征,在不同数据中心部署最合适的模型。甚至有些中心完全不部署某些模型,而是由其他地区动态调度。
我们不是做单点最优,而是做全球负载均衡。
Groq现在要解决的核心问题是如何满足巨大需求
哈里 那我问个哲学一点的问题:如果你现在完全不怕失败,你会做什么?
乔纳森 换个角度说吧,我们现在还有哪些风险没加码?
有一个明显的选择是:把供应链订单直接翻倍。我们的供应链响应周期是6个月,已经比几乎所有公司都快。
哈里 那你们现在的供需缺口到底有多大?
乔纳森 就说上周吧,有客户找我们,说他们需要的是当前算力的5倍。我们不能简单地说翻倍产能就够了。你得让产能不仅变多,还要足够大。
所以我们的风险选择是:要不要再翻一倍产能建设速度?
我们刚完成了一轮融资,本来计划融3亿,结果融7.5亿美元,直接翻倍,而且超额认购了4倍。
我们其实可以融更多,只是我对稀释比较谨慎,也在替投资人考虑。如果愿意接受更多稀释,我们完全可以新建更多算力中心。
而且我们还有一个关键优势:在同样推理速度下,我们的“每token成本”远低于同行。
这意味着我们有更强的价格竞争力,而这,才是真正对客户有价值的东西。
哈里 你是说客户对价格这么敏感?
乔纳森 不是敏感,也不是抠门,而是因为只要你把价格砍半,他们就能买两倍的算力。每一块钱的投入,都能直接提升模型的输出质量。
哈里 你们未来会考虑上市吗?
乔纳森 我们现在的全部精力都放在执行层面。
上市是另一种玩法,而我们现在要解决的核心问题只有一个:能不能满足市场对计算资源的巨大需求。
哈里 那你觉得Cerebras之前准备上市,后来又放弃,说明了什么?
乔纳森 他们不是最近才正式宣布不上市了吗?这就已经说明了一切(笑)。
不容错过的快问快答环节
哈里 来玩一轮快问快答吧。现在大家对英伟达最大的误解是什么?
乔纳森 以为他们的软件是护城河。CUDA的锁定效应根本是个神话。
哈里 真的吗?
乔纳森 在训练端也许是,但在推理端完全不是。我们现在已经有220万注册开发者在用Groq。英伟达说他们有600万CUDA用户?拭目以待吧。
哈里 如果你现在才创办Groq,英伟达已经市值四万亿,AI热潮已成,你还会选择做芯片吗?
乔纳森 不会了。这条船已经开走,现在做芯片就太晚了。
哈里 可现在还有很多芯片初创公司刚刚起步,而且拿到不少大钱。你觉得他们也来晚了?
乔纳森 太晚了。我当初之所以做芯片,是因为我在谷歌做过TPU,也和Google Brain的朋友一起,在ResNet50上做过最强分类实验,我们当时把所有模型全都击败了。
我完全可以去做算法,甚至做形式逻辑方向的AI。但我选了芯片,因为芯片有时间护城河。
风投机构常会问我:“你们的模式别人能不能复制?”
我说:当然能。但他们永远落后我们三年。
从设计到量产,哪怕执行完美也要三年。而我已经做了三个芯片项目,现在全部进入生产或准备量产阶段。
而且我们还是A0 silicon(一次流片成功)。你知道全球有多少芯片能一次成功?只有14%。
哈里 所以每次流片失败的概率是86%。那你们做V2芯片的时候也预留了失败重做的预算吗?
乔纳森 当然,我们本来就计划好第一次不成就再来一次。结果,出人意料地,一次就成功了。这是完全不可预期的。
所以我说“芯片开发周期是三年”,那是在一切顺利的前提下。
英伟达也差不多三到四年开发一代,但他们是多条产品线并行推进。
而我们Groq已经进入了“一年一代”的节奏:V2之后是一年内推出V3,再一年是V4。
哈里 你怎么看拉里·埃里森和甲骨文的“二次崛起”?
乔纳森 很聪明的商业判断,加上非常快的执行力。
现在很多人都在犹豫:AI会不会过热?我们该不该继续投?而甲骨文的选择是:直接上,不犹豫。
这就是赢的方法。你现在看到所谓的“贪婪市场”,其实只是少数几位行动迅速的人在赚大钱。
哈里 如果我是投资人,哪些地方该贪婪,哪些地方该恐惧?
乔纳森 你知道哈密尔顿·赫尔默的《七种力量》(7 Powers)吧?只要你能看到护城河,就该贪婪。
现实是,大多数公司根本没有护城河,特别是在早期阶段。
你要做的是:预判谁能构建出护城河。
所以我们应该给这种“护城河还没建立”的项目起个新名字:pre‑mo,也就是pre‑moat的简称。
哈里 过去一年,你在哪些问题上改变了想法?
乔纳森 严格说不是改变,而是不断聚焦。我们现在对“yes”的门槛越来越高,反而让业务变得更高效。
我以前觉得“保留选项”很重要,现在我觉得,聚焦才最重要。
当然,早期如果没有广泛尝试,我们也不会走到今天。但现在,我们只做最可能赢的那条路径。
哈里 你觉得埃隆·马斯克能把Grok和xAI做成功吗?
乔纳森 我觉得可以,但它们的终局形态可能和别人不一样。
每次出现一个新赛道,大家都以为彼此是竞争关系,其实未必。Anthropic就做得很好,他们聚焦在代码生成,做得极致。
xAI的策略是把chatbot融入社交场景,和社交网络结合得很好。我不会用他们的模型去写代码、搞科研,虽然他们也有代码模型,但他们没有代码的分发渠道。
市场会自然分化。就像现在的“七巨头”,每家公司业务有重叠,但核心方向不同。如果你不能做出差异化,你就会被淘汰。
哈里 那你怎么看谷歌、微软、亚马逊?三选一,你买谁,卖谁?
乔纳森 这取决于你怎么看时间维度。
短期内,微软可能会有些调整,毕竟它和OpenAI的关系现在有点微妙。但从长期来看,他们没问题,仍然很强。
哈里 你觉得这对微软的打击是实质性的吗?
乔纳森 不会。短期有影响,但长期无碍。
他们在OpenAI有股权,又能用Anthropic的工具,等于是“两头下注”。
再加上,他们已经投入了大量算力。哪怕OpenAI以后换算力供应商,微软手里的算力本身就是黄金,非常值钱。
至于亚马逊,我觉得他们缺乏AI的基因。
你刚才没提Meta,但Meta和谷歌一直有很强的AI文化。
微软靠OpenAI补上了,而亚马逊目前还没补上。不过他们至少有基础设施。
哈里 最后一个问题。我想用一个积极的话题收尾:未来五到七年,有什么是你最期待的?
乔纳森 我最期待的,反而是很多人感到害怕的东西。
我说的是,AI带来的影响。
我们可以用伽利略做个类比。
几百年前,伽利略让望远镜普及开来。那时人们第一次通过望远镜看清宇宙,才意识到宇宙远比想象更浩瀚,人类也因此显得无比渺小。那一刻让人恐惧。
但随着时间推移,我们逐渐明白:虽然我们渺小,但宇宙却更壮丽、更美。
今天,大语言模型(LLMs)就像“心智的望远镜”。它们让我们感到自己的智能渺小,是因为它们放大了“智能”这个概念的边界。
但我相信,100年后我们会意识到:原来,智能的世界,比我们想象得要辽阔得多。那会是一件美丽的事。
风险提示: 投资涉及风险,证券价格可升亦可跌,更可变得毫无价值。投资未必一定能够赚取利润,反而可能会招致损失。过往业绩并不代表将来的表现。在作出任何投资决定之前,投资者须评估本身的财政状况、投资目标、经验、承受风险的能力及了解有关产品之性质及风险。个别投资产品的性质及风险详情,请细阅相关销售文件,以了解更多资料。倘有任何疑问,应征询独立的专业意见。