索尼的乒乓球机器人赢了职业选手。Nature把它放上封面。这事跟乒乓球没什么关系。 | LostJobs.AI

4月23日周四,Nature发表了——并把它放上封面——索尼AI(Sony AI)的论文《用自主机器人击败精英乒乓球选手》(Outplaying Elite Table Tennis Players with an Autonomous Robot)。这台机器人叫Ace,在与五位精英业余选手(每位都有10年以上竞技经验)的对战中赢下13局中的7局,并在与两位日本职业联赛在役选手的7场比赛中赢下3整场比赛。索尼官方公告和Inside Project Ace博客交代了技术细节;Fortune报道和ScienceAlert负责面向公众的版本。

这是首个经同行评审、声明机器人在真实竞技体育中达到「人类职业水平」的结果。头条是胜负栏。和往常一样,有意思的细节藏在「方法」一节里。

Ace到底是什么

Ace不是人形机器人。它是单只八自由度机械臂(六个旋转关节,两个平移关节),装在一根沿球桌长边的精密直线导轨上,握一只标准球拍,旁边一个小杯子放球用于自主发球。视觉是一对立体相机,采样率700 Hz——大约是人类视觉系统辨识高速运动球速度的十倍。控制回路估算球的位置和旋转,预测轨迹,规划拍面角度和击球动作,然后执行——在一次回合中每隔几百毫秒重复一次。

训练栈的部分,是这个领域真正会关注的。索尼组合了:

从仿真到真实(Sim-to-real)的策略训练,在物理仿真器中用大量随机化对手击球库训练。
真实环境微调:先对发球机,再对人类陪练,再对段位逐级提高的对手。
分层控制:高层「战术」模块决定要进攻、防守还是落点;中层「击球」模块选上旋/下旋/搓/抽;低层「电机」模块负责接触力学。
没有遥操作、没有人工辅助、没有脚本对战。 Ace在真实场景中自主对人类,实时,采用人对人比赛的同一套规则。

这台机器人不比世界顶级选手强。研究中的职业选手是日本联赛在役职业选手,不是世界巡回赛排名顶端的高手。Ace还无法稳定击败那一档。但它有时候能赢这一档——而这个「有时候」,正是这个领域追了十五年的那条线。

刚刚被跨过去的那条线

机器人体育研究有一长串前作。Omron Forpheus(2014年起做乒乓球演示,从未稳定击败受过训练的玩家)。DeepMind 2024年那篇展示「业余水平」的乒乓论文。波士顿动力的跑酷。本月早些时候丰田CUE7从弧顶投进罚球。

4月23日的新事是:在职业选手最擅长的项目中,直接对抗、整场获胜;在对方无法走捷径的设置下(整场、整套规则、有真实输赢);并以这个领域视为权威的发表门槛(Nature、同行评审、方法完整披露)交付。这不是YouTube高光集锦。这是一篇封面论文。

论文真正讲的是什么能力

把这事读成体育新闻很诱人。但它不是体育新闻。乒乓球是索尼选的负载测试,因为它的难度有特定原因:

决策周期不到300毫秒。 22 m/s来球大约350 ms到达;机器人要在这窗口里感知、预测、规划、执行。
连续的感知-运动耦合。 旋转(可达每秒70+转)、速度、角度三者非线性交互。没有「离散状态」可以拿来规划。
对抗性对手。 人类在主动制造不可预测性。机器人不能预先规划;每一拍都要实时适应。
毫米级灵巧接触。 40 mm球与海绵橡胶拍面的接触面积只有几平方毫米。入射角的小误差会带来回球的大误差。

这四条性质,正是过去一直把机器人挡在快速、接触密集、对抗性、有真实赌注的工作环境之外的同一组性质——厨房、施工现场、医院手术室、车祸过程中的车内。Ace是一份单实例证明,说明这套技术栈对其中一种工作场景已经能跑通。索尼自己的措辞很谨慎——「迈向通用灵巧操作的一块踏脚石」——但技术贡献是真的,2027–2028年机器人能尝试什么的指向,影响很大。

LostJobs为什么关心一篇研究论文

非研究类站关心,有两条理由。

第一——可迁移性是要看的部分。Ace的控制架构,大致上,和人形机器人实验室在做仓储抓放时用的架构是同一套:分层控制、sim-to-real、视觉驱动的预测、接触不确定性下的实时执行。一份在乒乓球上击败日本联赛职业选手的研究成果,在结构上,也是一份其想法将在两年内落进工厂分拣抓放、手术辅助、自动驾驶对抗性博弈的研究成果。索尼不会把Ace卖给工厂。要卖给工厂的那些公司,正在读这篇论文。

第二——时机不是巧合。特斯拉Q1财报电话会议把Optimus V3量产时间正式定在7–8月之后两天,正好是谢弗勒1,000台AEON合约和埃森哲—沃达丰杜伊斯堡人形机器人试点同一周,索尼AI在Nature封面证明了所有那些部署核心的AI控制问题在一个明确定义的任务上,已经达到人类专家水平。机器人产业故事和机器人研究故事,本周在同一周收口。这两条线已经悄悄收口两年了;到目前为止,这是最响的一个4月。

这件事不意味着什么

几条要按在地板上:

Ace不是「智能」。 它是建立在大量结构化训练上的极致实时控制。它对乒乓球的「理解」,不比AlphaGo对围棋的「理解」更多。但它会赢。
Ace不是人形机器人。 装在直线导轨上的机械臂去不了你的厨房。把Ace的控制思路迁移到双足自由行走平台,是另一个独立的、更难的、多年的问题。
Ace打赢的职业选手不是世界顶端。 2026年和张本智和或王楚钦的比赛,会非常不同。但从「7场赢日本联赛职业选手3场」到「胜过世界巡回赛前10」,在底层配方对的领域里,历史上需要18–36个月。

LostJobs为什么关心

LostJobs这个4月的机器人头条,一直是产业线:人形机器人工厂试点、欧盟采购、量产线开线。Ace是另一种叙事形状。它是这些产业试点变得难以忽视的研究那一半原因。当学术前沿穿过「在他训练了二十年的事情上击败职业选手」这条线之后,从这一刻起的每一份试点部署,在一两年内会继承一套更强的控制栈。

加一句脚注:索尼研究中的精英业余选手平均每周训练约20小时,加上十年以上的训练积累。Ace在仿真中训练了大约6个月。在对抗性物理技能这条赛道上,「计算时间对训练小时数」的曲线,现在弯的方向和1997年的国际象棋、2016年的围棋、2021年的蛋白质折叠一样。这条曲线下一个要弯过来的领域,是我们以前称之为「人类不可被简化部分」的那部分体力工作。

Nature论文摘要里给这件事的礼貌措辞是 「现实世界具身智能的一个里程碑」。直白一点的措辞,是头条。