Brian Gerkey 周三5月28日开幕波士顿机器人峰会,主旨「AI驱动机器人时代的开放基座」——Intrinsic CTO兼Open Source Robotics Alliance主席要论证:在NVIDIA Isaac、Google Gemini Robotics、Physical Intelligence π0把机器人软件层锁进三条专有栈之前,ROS必须先变成视觉-语言-动作模型的Linux。6,000+工程师到场。Unitree均价从2023年8.5万美元跌到2025年2.5万美元,毛利率反而提升到约60%。硬件刚商品化,平台仗才开始

2026年机器人峰会5月27-28日在波士顿开幕。Intrinsic CTO Brian Gerkey周三的主旨演讲要论证:开源ROS必须吸收VLA架构转变——否则就会沦为NVIDIA Isaac、Gemini Robotics、Physical Intelligence专有栈下面的遗留层。这是一场抢硬件刚商品化的行业的平台层的仗。

Brian Gerkey 周三5月28日开幕波士顿机器人峰会,主旨「AI驱动机器人时代的开放基座」——Intrinsic CTO兼Open Source Robotics Alliance主席要论证:在NVIDIA Isaac、Google Gemini Robotics、Physical Intelligence π0把机器人软件层锁进三条专有栈之前,ROS必须先变成视觉-语言-动作模型的Linux。6,000+工程师到场。Unitree均价从2023年8.5万美元跌到2025年2.5万美元,毛利率反而提升到约60%。硬件刚商品化,平台仗才开始

过去十八个月人形机器人的故事一直是「硬件已经能干活了」。Figure 02在宝马Spartanburg跑完11个月,参与制造3万多辆X3Agility的Digit在GXO佐治亚Flowery Branch搬了10万多个料箱波士顿动力的Atlas 2026年产能全部锁给现代和Google DeepMind宇树科技的IPO招股书披露其人形机器人均价从2023年约8.5万美元降到2025年约2.5万美元——两年掉70%——毛利率反而提升到约60%

这串事件是开场。本周开始的故事是「现在谁拥有软件」。

周三5月28日上午9点东部时间,托马斯·M·梅尼诺会展中心253 ABC厅Brian Gerkey开幕2026机器人峰会,主题「AI驱动机器人时代的开放基座」。Gerkey是Open Robotics(维护ROS和Gazebo模拟器的组织)联合创始人、Intrinsic(Alphabet的机器人子公司)CTO、并担任Open Source Robotics Alliance(OSRA)主席——这个仿Linux基金会模式的治理组织2024年成立,创始成员包括NVIDIA、高通和Intrinsic。他的主旨演讲是一场仗的开场陈词——这场仗的存在本身,行业才刚刚承认。

主旨演讲在回应什么样的转变

ROS是大多数商用机器人的默认起点,全球几百万部署机器人在跑。它的设计早于当下席卷该领域的架构转向:视觉-语言-动作(VLA)模型——一个单一的学习系统,输入是摄像头流加自然语言指令(「拿起蓝色杯子放到桶里」),输出直接是连续电机指令。没有独立的感知模块,没有独立的规划模块,没有手工拼起来的控制系统。

目前活跃部署的VLA实现已经多到没法装作没看见这个架构转折。Figure AI的Helix。 NVIDIA的Isaac GR00T N1。 Google DeepMind的Gemini Robotics。 Physical Intelligence的π0。 Covariant的机器人学习框架。每一个都是一套模型栈,自带训练流水线、自带数据飞轮、自带硬件偏好。

战略问题不是VLA模型能不能用,明显能。战略问题是ROS会变成VLA模型的原生基座——模型栈坐在上面的开放标准——还是变成专有平台一边容忍一边把所有重要东西悄悄塞进自己墙内的遗留层

The Robot Report的覆盖,Gerkey要论证的是:开源基础设施「不只是开发便利」,而是「大规模、可协作、可信任的物理AI开发的必要脚手架」。OSRA治理模式存在的全部意义就是把ROS提升到企业级——给财富500强制造商的采购和法务部门一个单点问责对象,而不是一堆碎片化的社区repo。Linux类比是刻意的。赌的是:把业余OS变成AWS、Android和过去十年所有消费设备底层的那套治理模式,能在VLA原生机器人上重做一遍。

专有栈长什么样

这是一个四方市场,每个参与者的锁定向量都不同:

  • NVIDIA Isaac GR00T N1。 CES 2026发布,黄仁勋称之为「机器人的ChatGPT时刻」。Hugging Face开权重,但在NVIDIA Jetson硬件上跑得最好。Android-for-robots定位很明显。锁定在芯片层。
  • Google DeepMind Gemini Robotics。 原生集成Google更大的AI云和TPU栈。波士顿动力2026年Atlas产能分给现代和Google DeepMind不是巧合——DeepMind需要机器人身体来给VLA训练打地基;Atlas需要模型栈来跑。锁定在云层。
  • Physical Intelligence π0。 专有模型,不公开权重。锁定就是模型本身。
  • Figure AI Helix。 单一OEM专有栈,机器人和模型一起出货。锁定在平台。

第五个槽位——开放的那个——就是Gerkey站位的地方。Open Robotics的答案是OSRA治理的ROS + 开放VLA训练基础设施 + 开放模拟(Gazebo),论点是这是唯一一种不从每个下游OEM、集成商和终端用户身上抽平台租的配置。

硬件商品化曲线为什么让时间窗口变得紧

宇树那组数字是承重数据点。2023年8.5万美元均价→2025年2.5万美元均价,同时毛利率提升到约60%,这是一个硬件品类越过成本曲线、进入标准化阶段的明确签名。更宽的行业数据显示同一窗口内成本降幅40-60%。特斯拉Optimus目标量产单价约2万美元。1X的Neo定价2万美元加499美元/月订阅。

硬件商品化时,可持续利润移向软件层。这是PC业经历过的同一转向(利润从IBM/康柏移到微软和英特尔),是智能机业经历过的同一转向(利润从诺基亚/摩托罗拉移到苹果和Google),也是云基础设施业经历过的同一转向(利润从服务器OEM移到AWS、Azure和GCP)。2026年机器人的问题是这笔平台租金归NVIDIA、归Google、归Physical Intelligence,还是归一个开源公地。

这场仗必须现在解决而不是2028年再解决,是因为2026年选机器人软件栈的公司,做的是三年后翻盘很贵的决定。一旦一家财富500强制造商把数据飞轮建在Isaac上、车间培训按Gemini的API模式重训、和一个模型只在自家芯片上跑的厂商签了多年RaaS合同,转换成本就是一个多年的变更管理项目。专有栈很清楚这点。OSRA的卖点——直白地说——是采购应该把这件事当成1999年选Linux而不选某个专有Unix的同一类决定。

议程信号告诉你部署经济落在哪里

峰会的物流自动化主轨是最强商业主轨,因为仓库自动化是人形机器人单位经济先达到正ROI的地方。议程贡献者包括Agility Robotics(亚马逊大股东,Digit在GXO和丰田加拿大制造2026年2月签了商用RaaS)、Figure AI(宝马Spartanburg背书,Figure 03正在部署)、和**Mind Robotics**——Rivian 2025年11月分拆的公司,2026年3月以20亿美元估值募了5亿美元A轮。

Mind Robotics入选是个有意思的tell。创始人RJ Scaringe的措辞——「翻跟头在制造业里不创造价值」——是来自一个有信誉工业创始人的明确反人形论点。峰会把Mind Robotics和Figure、Agility放一个程序里,是程序委员会公开承认:平台仗不只是人形对人形;它是哪种机器人形态赢哪种任务、哪一套软件栈跨所有形态运行的更广问题。

另一个有意思的与会者是桌底下的大象。宇树的机器人受中国《国家情报法》约束,公司目前正在美国众议院国土安全委员会就国家安全审视上,5月21日还提了一个《2026年阻止中共间谍科技法案》。市场上最便宜的硬件,是西方企业采购被告知不能买的那个。开源软件栈是「我们在能过采购的西方造机器人上跑什么」这个问题唯一可信的答案。

关注什么

  • 周三主旨演讲的语气。 Gerkey是直接在台上点名NVIDIA、Google DeepMind、Physical Intelligence和Figure,还是只是暗示。专有备选被点名时Linux类比才有效(Linus Torvalds点名过微软);含糊就完了。点名选择就是主旨演讲本身。
  • 峰会上的OSRA成员公告。 OSRA 2024年由NVIDIA、高通、Intrinsic创办成立。NVIDIA同时押Isaac是OSRA创始会员当初没预料到的局面。本周宣布的任何新企业成员——特别是任何人形OEM——都是平台仗朝哪边倒的领先指标。
  • Figure AI的公开姿态。 Figure的Helix是部署最多的单一OEM专有栈。Figure到峰会是以OSRA贡献者身份还是竞争平台身份出现,是最干净的读数,看该领域会围绕一个开放栈整合还是按OEM分裂。
  • 首个财富500强采购决定。 5月25日Tech Times那篇把这个选择定为「三年内翻盘很贵」。首家公开承诺一套栈——开放、NVIDIA、Google或Physical Intelligence——的具名财富500强制造商,是平台答案从辩论变成客户参考案例的时刻。