Figure 03 对战实习生Aime,5月17日:人类以12,924比12,732赢下10小时分拣赛——胜负差就是192个包裹、平均每个包裹2.79秒对2.83秒——加州劳动法强制的就餐与休息时间是全部差距——Aime左前臂「基本上废了」,机器人编队已经连续运行116小时,Adcock:「这是人类最后一次赢」

Figure AI让一名实习生跟一队Figure 03对干10小时。人类赢了192个包裹。机器人没有休息、没有起水泡的手指,到第116个小时还在干。

Figure 03 对战实习生Aime,5月17日:人类以12,924比12,732赢下10小时分拣赛——胜负差就是192个包裹、平均每个包裹2.79秒对2.83秒——加州劳动法强制的就餐与休息时间是全部差距——Aime左前臂「基本上废了」,机器人编队已经连续运行116小时,Adcock:「这是人类最后一次赢」

5月17日星期日,Figure AI的CEO Brett Adcock办了一场10小时的包裹分拣对战——一边是名字叫Aime的实习生,另一边是自5月13日就在不间断运行的Figure 03机器人编队。同一条传送带,同样的任务——读条码、抓起箱子、面朝下放到传送带上。账面上同样的班次时长。

人类赢了。差距是10个小时里多分拣了192个包裹。这个人类的手指起了水泡,左前臂被他自己形容为「基本上废了」。Adcock在X上贴出最终比分的那条帖子用了一句标题党都在等的话:「这是人类最后一次赢。」

这句话用在Figure的投资人路演里很合适。但它也遮住了这场测试到底证明了什么。

数据

指标Aime(人类)Figure 03编队差值
10小时累计包裹数12,92412,732人类+192
每个包裹平均秒数2.792.83人类快0.04秒
加州法定就餐时间30分钟0
加州法定休息时间2 × 10分钟0
机械/身体故障1(左前臂)0
截至目前的连续运行时长10小时116小时49分钟
直播以来累计输出145,320个包裹

头条数据是「人类12,924对12,732获胜」。结构性的数据是「10小时差192个包裹、每箱差0.04秒」。真正的套利是人类必须按加州法律拿走的50分钟法定就餐与休息时间——而机器人不用。把休息时间剔掉之后,每分钟有效工作的吞吐量已经倒在机器人那一边。把休息时间留着,人类赢的幅度不到1%。

Helix-02为了缩进0.04秒做了什么

Figure 03编队跑的是Helix-02——Figure的端到端视觉-语言-动作模型,输入是原始相机像素、输出是电机指令,没有任何中间的脚本化抓取与放置逻辑。让整个分拣单元看起来像一个永不间断的工人,靠的是电池热插拔轮换协议:Bob的电量掉到20%时,Frank直接补位,传送带的节拍不间断。所谓「编队」是个用工抽象,而不是硬件抽象——背后是五台实体机(Bob、Frank、Gary、Rose、Jim)在一个工位前轮班,正好是这一队公司希望未来仓库经理理解「人形劳动力数」的方式。

结果里有两件事值得标出来。

第一件是峰值与累计曲线的形状。Aime的前三小时明显比2.79秒快——Adcock以前展示过人类在前九十分钟能跑到大约2.4秒。把整轮算下来的2.79秒,反映的是人类标准的疲劳曲线:到第七、八、九小时被拖下来,再在收尾的一小时小幅回弹。Figure 03的节拍在十小时里是平的。机器人优化的不是峰值速度,是一致性。

第二件是失效模式。Aime左前臂「基本上废了」,按工伤补偿的口径,通常属于慢性损伤索赔而不是急性伤害。这场比赛把仓库地板上几周的累积暴露压缩进了一个班次。同一窗口里、以及直播至今已经积累的116小时连续运行里,Figure 03编队没有任何机械故障。在人类把自己前臂干废的临界点上,机器人运行得像还没开始上班。

劳动法漏洞,换个说法再说一次

这场测试里最容易被这一队公司悄悄吸收的事实,是哪一方需要法律保护。

Aime拿到30分钟就餐和两个10分钟的休息,因为加州劳动法说他必须拿。Figure 03拿到0次休息,因为人形机器人的休息权法律框架还不存在。192个包裹的差距,从经营口径看就是「法律保护溢价」——一个人类工人因为有身体、受工资工时法管辖,被允许保留的吞吐量。

这个结果不可推广的部分就在这里。换到休息规则更松的州——德州、佛州、大多数非工会部署——同样的对抗、同样的人类、同样的身体状况,能打成平手都属于乐观,第二天班次上Aime的前臂恢复不过来时机器人就赢了。「这是人类最后一次赢」这句话其实跟下一次10小时测试没多大关系。它真正问的是:Figure 03下一次落地的工位,到底在不在一个还保护工人休息权的辖区。

这场测试没有证明的事

这是一场透明度满满的营销动作——Adcock自己说了「我们闲得无聊」——在这个口径上是成立的。机器人编队在跟人类可比的全程审视下没有出过故障、跑的是相同的工作流、并且是在现场观众面前完成的。

但有三件事这场测试故意没有测,而它们恰好是仓库经理真正在买的东西。

第一是任务切换。两边在整整10小时里跑的是同一个、预加载好的、单一技能的工作流。这一队公司在真实部署里反复被卡住的环节,恰恰是改任务的成本——从「抓包裹平放传送带」切换到「从大箱里挑零件装套件」,要么需要一个新的Helix-02提示和验证周期、要么需要人类介入。Aime被重新分配到一个新任务大概只要30秒。Figure 03做不到。

第二是错误模式。Helix-02已经展示过在分拣单一场景下的24/7全自主运行。这10小时里没记录的,是边缘案例的失败率——包装破损、条码贴错、密度不均的混装箱要重新规划抓取方案——这部分仓库现在仍然严格依赖Aime,也是下一个Helix迭代要解决的部分。

第三是经济账。Adcock会用机器人即服务(RaaS)的口径,把一台工业人形机器人的小时单价报到接近低端仓库工人的工资水平。这次测试没有把真实的成本栈摆出来——资本支出、充电基础设施、Helix迭代的工程师工时、监督机器人的人类——这些东西买方必须吸收。BMW Spartanburg那个开了11个月、生产了30,000辆X3的试点才更接近真实世界的这笔账。10小时分拣赛是为转发优化过的版本。

把这件事放回整条队列里

我们追踪的AI裁员周期的「物理证据」层现在自己也在出节奏——Figure的直播、Schaeffler跟Humanoid公司签下的数千台部署单丰田加拿大的七台Digit、现代汽车宣称2028年在乔治亚州年产30,000台Atlas——模式都很一致。头条是一场透明度极高的演示,演示真正在卖的,是消除掉法律保护溢价、休息时间、轮班加成、工伤索赔以及招聘漏斗。

Aime周日以12,924对12,732赢下了对决。这场测试展示的事是:在湾区一家受加州劳动法约束的设施里、在「单一任务执行」这个口径上,一个健康实习生跟当前一代人形机器人之间的差距,是每个包裹0.04秒、加上一条前臂。这不是大多数仓库运营商正在算的那个差距。

接下来盯什么

  • **Figure 03的第二班。**截至本文写作时,机器人编队已经连续运行116小时。200小时——五个连续40小时工作周——是其他人没展示过的节点,也是Adcock那句话从营销口径变成经营事实的拐点。
  • **第一场加州之外的复赛。**如果Figure在德州、佛州或田纳西州找一个没有强制就餐与休息保护的工人重打一场,下一个新闻稿基本是写好的。
  • **第一场多技能对决。**10小时分两段——5小时分拣、5小时拆装、中间不允许Helix-02重新训练——是Adcock到现在还没办的测试。哪一天他办了、并且机器人通过了,仓库经理那笔账就会朝着「每秒多少箱」永远换算不回来的方向变动。
  • **Aime的下一份工作。**Figure有充分的公关理由展示这位实习生在班次结束后去哪里了。这一队公司面对的2026届毕业生问题,答案目前并不明显。

机器人周日没赢。机器人也不需要赢。机器人只需要让法律保护溢价被定价高于每个包裹0.04秒——而截至5月17日,正是这样定价的。

资料来源