热门资讯> 正文
2026-03-27 08:13
整理丨TOP创新区研究院FTA Group
图源丨Midjourney
2026年,人形机器人赛道正当红。
每天我们都看到有的机器人在练武术,有的在打网球,有的在折叠衬衫,有的甚至在用自然语言与人类探讨哲学。但在这些酷炫的Demo背后,投资人和产业界却陷入了深深的信息焦虑——没有人知道这些机器人的真实造价,没有人知道视频背后隐藏了多少次失败的NG,更没有人清楚这台精密仪器的肚子里,究竟塞满了谁家的零部件。
好了,Humanoid Atlas (humanoids.fyi) 这个开源网站就是解决这个问题的。
额外的好消息是,它不用付费,不用注册,直接打开就能看到所有信息。
它的缔造者Julian Saks的本意也不是做一个高深莫测的智库,他很单纯,他想做一个免费的:“人形机器人领域的彭博终端(Bloomberg Terminal)”。
我们知道,彭博终端终结了金融市场的信息不对称,很显然,Humanoid Atlas就是想解决人形机器人赛道的信息不对称的问题,撕下公关伪装,通过SKELETON(核心骨架)、ALL OEMS(整机厂全景)、GEOPOLITICS(地缘政治)和 NETWORK(供应链网络)等几个关键标签,拆解成一张张冷冰冰的 BOM(物料清单)表和供应链拓扑图,进而看清这个行业竞争的本质。
成本的物理学
跨越1万美元的“生死线”
在Humanoid Atlas的终端里,最先引起我们注意的是那张实时更新的“OEM价格与BOM估算表”。
在这一页,全球二三十家头部企业的数据并列在一起,你可以看到一件有意思的事情,那就是——两极分化。
在表格的下端,是美国机器人们,价格高昂:Agility Robotics的工业级型号动辄标价25万美元;Apptronik售价15万美元;哪怕是拥有极致垂直整合能力的特斯拉Optimus,目前的BOM成本也徘徊在4万美元左右,马斯克那句“将售价打到2万美元以下”的承诺,依然是一个需要时间去兑现的远期目标。
而在表格的上端,中国军团的数据则展现出了令人窒息的工业压迫感:宇树科技(Unitree)的G1模型,BOM成本被精准地框定在11500美元,量产售价仅为13500美元;
智元(AGIBot)、星动纪元(EngineAI)等头部企业的机型,也悉数杀入了2万到4万美元的价格带。
甚至,像Noetix这样的厂商,已经探出了5500美元的击穿底线的极限数字。
为什么成本差异如此巨大?我们首先要明白,人形机器人第一性原理的核心,是模拟人类的自由度(DOF)。
为了让机器人能像人一样走路、下蹲、抓取,一台标准的人形机器人大约需要配置20到40个旋转执行器(Rotary Actuators)和线性执行器。
这是整个系统的“阿喀琉斯之踵”。
Atlas的数据指出,一个标准的旋转执行器,吃掉了整机极大的成本份额:谐波减速器(Harmonic Reducer):占据 36% 的成本。力矩传感器(Torque Sensor):占据 30%。无刷电机(BLDC Motor)及其他:约 34%。
这就是成本的物理学。
成本占比↑
要让机器手臂在举起10公斤重物的同时,还能精确到毫米级去穿针引线,且在运动反转时没有丝毫的机械旷量(即“零背隙 Zero-backlash”),你就必须依赖高精度的谐波减速器和极度灵敏的六维力传感器。
中国整机厂之所以能把成本压缩到老牌厂商的十分之一,是因为他们吃到了过去十年新能源汽车(EV)和消费级无人机产业的庞大红利溢出。
从珠三角到长三角,庞大的供应链网络能够迅速提供低成本的压铸件、高密度的电池包和车规级的电机。
当美国工程师还在为如何采购高性价比零部件发愁时,中国工程师已经可以在深圳和东莞的工厂里,用极其低廉的打样成本进行每周一次的硬件迭代。
这是典型的“制造摩尔定律”——用规模效应和供应链密集度,暴力踏平机械硬件的成本门槛。
谁在赚走机器人行业的
真金白银?
但如果仅仅把目光停留在整机厂的报价上,你只看到了产业的表象。
Humanoid Atlas的“NETWORK(供应链网络)”和“GEOPOLITICS(地缘政治)”标签,还为我们揭示了一张错综复杂的隐秘暗网。
在这场轰轰烈烈的机器人造神运动中,目前真正赚到钱的,其实是隐藏在水下的“卖水人”。
以占据执行器成本 36% 的谐波减速器为例,这本质上是一个材料学与精密加工的“黑魔法”。在过去几十年里,这个领域的高端市场几乎被日本企业(如哈默纳科 HDSI)独占。尽管中国涌现出了绿的谐波等优秀的替代者,但在超高扭矩和极限寿命等核心指标上,高端产能依然是一个巨大的瓶颈。
所以,当特斯拉宣布要年产百万台Optimus时,整个行业算了一笔账:全球现有的高精度减速器产能加在一起,都不够给特斯拉一家供货。
默纳科谐波减速器
这就引出了地缘政治阴影下最脆弱的一环。
打开图谱中的供应链溯源,你会发现:美国的人形机器人要动起来,其电机离不开稀土永磁材料(钕铁硼),而全球绝大部分的稀土冶炼和加工产能集中在中国;其传感器、丝杠和基础机电组件,也高度依赖亚洲的代工体系。
如果未来由于不可抗力的地缘政治因素,全球供应链发生硬性脱钩,欧美人形机器人的关键零部件成本可能会在瞬间飙升2到3倍。
而为了对抗这种脆弱性,中美企业正在走向两条截然不同的突围之路。
中国路线是“生态化反”。
OEM厂商们在极度内卷的国内市场,通过扶持本土化供应商,不断将减速器、传感器的价格底线击穿。
我们愿意牺牲一部分早期的极限性能,换取快速量产的能力,用“先卖出去5000台”来跑通商业闭环。
美国路线则是“极致的垂直整合”。
马斯克的逻辑一如既往:既然外部供应商又贵又不可控,那我就自己造。
特斯拉不仅自己在做FSD算法和Dojo算力中心,甚至开始深入到执行器结构、甚至自研电机的最底层设计。
这是一条极度重资产、高风险的险途;但一旦走通,特斯拉将拥有世界上最深的护城河——一个掌握从原子到比特全部Know-how的工业巨兽。
幽灵与宿体
当VLA模型注入钢铁骨架
如果说降本是人形机器人大规模商业化的前提,那么“通用性”才是其最终的商业闭环。
在Atlas的“VLA(Vision-Language-Action,视觉-语言-动作)”标签页里,记录着这场产业革命的灵魂。
过去的机器人,为什么看起来总是笨笨的?
因为它们是“基于规则(Rule-based)”的系统。
你要让它端起一杯咖啡,程序员必须写下无数行代码,精准设定坐标(X, Y, Z)和关节的角度。只要桌子稍微倾斜,或者杯子换了形状,机器人就会像个傻子一样在空气中乱抓。
Physical World
但2024年底到2026年初爆发的具身智能(Embodied AI)大模型,彻底颠覆了这一切。
通过接入类似Nvidia GR00T、OpenAI相关模型以及各大开源VLA架构,机器人开始像人类一样思考:
输入端:它通过摄像头看到“桌面上有一杯水”,通过麦克风听到“我渴了”。
大脑中枢:VLA大模型在庞大的神经网络中进行物理常识的推理(口渴 -> 需要水 -> 水在杯子里 -> 需要拿起杯子递给人类)。
输出端:模型不再输出生硬的代码坐标,而是直接端到端(End-to-End)地输出给关节电机的扭矩信号。
在这个范式下,硬件仅仅是一个“宿体(Vessel)”,数据才是真正的壁垒。
这就解释了为什么特斯拉要在工厂里雇佣数百名工人,让他们穿戴着动作捕捉设备,日以继夜地演示如何搬运箱子、如何分拣零件。他们不是在作秀,而是在为VLA模型提炼最宝贵的“遥操作数据(Teleoperation Data)”。
在这一维度上,美国的先发优势明显。
Figure能够迅速崛起并获得超高估值,很大程度上是因为它直接插上了OpenAI的大模型翅膀。
但是,千亿参数模型在物理世界中积攒的“直觉(Intuition)”和边缘案例(Corner Cases)数据池,是无法靠单纯的资金砸出来的——这或许也是中国的优势。
终局演练
站在今天,对于关注这个赛道的人来说,产业的下半场,拼的是三个极其硬核的指标:
工程化降本能力:谁能率先把全量产的BOM成本压倒1万美元的临界点之下,且保证一万小时无故障运行(MTBF)。
供应链掌控力:谁能在谐波减速器、空心杯电机、六维力传感器这些被少数供应商卡脖子的环节,实现技术突围或深度的利益绑定。
高质量数据飞轮:谁能最先在真实场景(汽车产线、仓储物流,乃至最后的家庭服务)中部署上万台设备,通过真实物理反馈反哺自家的VLA模型。
在一个跑步进入物理AI(Physical AI)的世界里,每一次依赖关系的厘清,都意味着创新周期的缩短。
这个免费的网站Humanoid Atlas。就是将一切竞争拉回到了工业与科技最本质的维度——成本、效率、供应链与算力。
你站在哪一个维度?