4 月 23 日週四,Nature 刊出——而且放上封面——Sony AI 的論文《以自主機器人擊敗精英桌球選手》(Outplaying Elite Table Tennis Players with an Autonomous Robot)。這台機器人叫 Ace,在對五位精英業餘選手(每位都有十年以上競技經驗)的對戰中贏下 13 局中的 7 局,並在對兩位日本職業聯賽在役選手的 7 場比賽中贏下 3 整場。Sony 的官方公告和 Inside Project Ace 部落格交代了技術細節;Fortune 報導和 ScienceAlert 是面向大眾的版本。
這是首篇經同行審查、聲稱機器人在真實競技運動達到「人類職業水準」的成果。頭條是勝負欄。和往常一樣,有意思的細節藏在「方法」那一節。
Ace 到底是什麼
Ace 不是人形機器人。它是單支八自由度機械臂(六個旋轉關節、兩個位移關節),裝在一條沿球桌長邊的精密直線導軌上,握一支標準球拍,旁邊一個小杯子放球用於自主發球。視覺是一對立體相機,取樣率 700 Hz——大概是人類視覺系統辨識高速球速度的十倍。控制迴路估算球的位置與旋轉,預測軌跡,規劃拍面角度與擊球動作,然後執行——一個回合內每隔幾百毫秒重複一次。
訓練堆疊的部分,是這個領域真正會關注的。Sony 組合了:
- 從模擬到真實(Sim-to-real)的策略訓練,在物理模擬器中以大量隨機化對手擊球庫訓練。
- 真實環境微調:先對發球機,再對人類陪練,再對段位逐步提升的對手。
- 分層控制:高層「戰術」模組決定要進攻、防守還是落點;中層「擊球」模組挑上旋/下旋/搓/抽;底層「馬達」模組負責接觸力學。
- 沒有遠端遙控、沒有人機在環、沒有腳本對戰。 Ace 在真實場景中自主對人類,即時,使用人對人比賽的同一套規則。
這台機器人不比世界頂尖選手強。研究中的職業選手是日本聯賽在役職業選手,不是世界巡迴賽排名頂端的高手。Ace 還沒辦法穩定贏這一檔。但它有時候能贏這一檔——而那個「有時候」,正是這個領域追了十五年的那條線。
剛剛被跨過的那條線
機器人運動研究有一長串前作。Omron Forpheus(2014 年起做桌球展示,從未穩定擊敗受過訓練的玩家)。DeepMind 2024 年那篇展示「業餘水準」的桌球論文。波士頓動力的跑酷。本月初Toyota CUE7 從弧頂罰進那一球。
4 月 23 日的新事是:在職業選手最擅長的項目中,直接對戰、整場獲勝;在對方無法走捷徑的設置下(整場、整套規則、有真實勝負);並以該領域公認權威的發表門檻(Nature、同行審查、完整方法揭露)交付。這不是 YouTube 精華片段。這是一篇封面論文。
論文真正講的是什麼能力
把這件事讀成運動新聞很誘人。但它不是運動新聞。桌球是 Sony 選的負載測試,因為它的難度有特定原因:
- 不到 300 毫秒的決策週期。 22 m/s 的來球大約 350 ms 到達;機器人要在這個窗口裡感知、預測、規劃、執行。
- 連續的感知-運動耦合。 旋轉(可達每秒 70+ 轉)、速度、角度三者非線性互動。沒有「離散狀態」可以拿來規劃。
- 對抗性對手。 人類在主動製造不可預測性。機器人不能預先排程;每一拍都要即時調整。
- 毫米尺度的靈巧接觸。 40 mm 球與海綿膠面的接觸面積只有幾平方毫米。入射角的小誤差會帶來回球的大誤差。
這四條性質,正是過去一直把機器人擋在快速、高接觸、對抗性、有實質賭注的工作環境之外的同一組性質——廚房、工地、醫院手術室、車禍中的車內。Ace 是一份單實例證明,說明這套技術堆疊對其中一種工作場景已經跑得通。Sony 自己的措辭很謹慎——「邁向通用靈巧操作的一塊踏腳石」——但技術貢獻是真的,對 2027–2028 年機器人能嘗試什麼的指向,影響很大。
LostJobs 為什麼關心一篇研究論文
非研究類網站關心,有兩個理由。
第一——可遷移性是要看的部分。Ace 的控制架構,大體上,和人形機器人實驗室在做倉儲抓放時用的架構是同一套:分層控制、sim-to-real、視覺驅動預測、接觸不確定性下的即時執行。一份在桌球擊敗日本聯賽職業選手的研究成果,結構上,也是一份其概念將在兩年內落到工廠分揀抓放、手術輔助、自動駕駛對抗性博弈的研究成果。Sony 不會把 Ace 賣給工廠。要賣給工廠的公司,正在讀這篇論文。
第二——時機不是巧合。Tesla Q1 法說會把 Optimus V3 量產時間正式定在 7–8 月後兩天,正好是Schaeffler 1,000 台 AEON 合約與Accenture–Vodafone 杜伊斯堡人形機器人試點同一週,Sony AI 在 Nature 封面證明了所有那些部署核心的 AI 控制問題,在一個定義清楚的任務上達到人類專家水準。機器人產業故事與機器人研究故事,在同一週收口。這兩條線安靜收口已經兩年;到目前為止,這是最響亮的一個四月。
這件事不代表什麼
幾條要按在地板上:
- Ace 不是「智慧」。 它是建立在大量結構化訓練之上的極致即時控制。它對桌球的「理解」,不比 AlphaGo 對圍棋的「理解」更多。但它會贏。
- Ace 不是人形機器人。 裝在直線導軌上的機械臂進不了你的廚房。把 Ace 的控制思路移到自由行走的雙足平台,是一個獨立、更難、多年的問題。
- Ace 贏的職業選手不是世界頂尖。 2026 年若對上張本智和或王楚欽,結果會非常不同。但從「七場贏日本聯賽職業選手三場」到「贏世界巡迴賽前 10」,在底層配方對的領域,歷史上需要 18–36 個月。
LostJobs 為什麼關心
LostJobs 在這個四月的機器人頭條一直是產業線:人形機器人工廠試點、歐盟採購、量產線開線。Ace 是另一種敘事形狀。它是這些產業試點變得難以忽視的研究那一半原因。當學術前沿跨過「在他訓練了二十年的事情上擊敗職業選手」這條線後,從這一刻起的每一份試點部署,將在一兩年內繼承一套更強的控制堆疊。
附一句腳註:Sony 研究裡的精英業餘選手平均每週訓練約 20 小時,再加上超過十年的訓練累積。Ace 在模擬中訓練約 6 個月。對抗性物理技能這條賽道上,「計算時間對訓練小時」的曲線,現在彎的方向跟 1997 年的西洋棋、2016 年的圍棋、2021 年的蛋白質摺疊一樣。這條曲線下一個要彎過來的領域,是我們以前稱為「人類不可被化約那一塊」的體力工作。
Nature 論文摘要對這件事的禮貌措辭,是 「現實世界具身 AI 的一個里程碑」。直白一點的措辭,就是頭條。