DeepL 5月7日领英帖:「AI 原生」的代价是科隆裁员250人(25%)、收购 Mixhalo 音频团队,以及一场和通用大模型悄悄进行的赛跑

5月7日,DeepL CEO 在领英上宣布:这家 AI 翻译先驱将裁员约250人(占1,000多人的25%),重组成一家「AI 原生」公司,并收购 Mixhalo 切入实时语音翻译。没说出来的真正原因:GPT 这一代通用大模型的翻译,已经免费且够用了。

DeepL 5月7日领英帖:「AI 原生」的代价是科隆裁员250人(25%)、收购 Mixhalo 音频团队,以及一场和通用大模型悄悄进行的赛跑

DeepL CEO Jarek Kutylowski 5月7日(周四)在领英上发文,宣布这家总部在科隆的 AI 翻译公司将裁员约250人——占1,000多人总员工数的25%——并重组成一家「AI 原生」公司。他形容这是「职业生涯里最艰难的决定」。原话给出的理由是:「来自人工智能的巨大结构性转变」。

这句话值得读两遍。一家 AI 翻译公司的 CEO,正在以「来自 AI 的巨大结构性转变」为理由,裁掉四分之一的员工。他卖的那个东西,刚刚把他自己挤出了赛道。

整个故事其实就是这一句话。但值得拆开看,因为接下来18个月里,会有一长串「单一用途的 AI 专家公司」走上同一条路。

DeepL 当年的护城河,到底是什么

DeepL 2017年带着一套神经机器翻译(NMT)系统上线,在欧洲语种对的人工评测里,翻译质量明显好过谷歌翻译。这个位置守了差不多七年,是真的有壁垒——翻译质量很难造假;训练语料也是真的资产(欧盟机构的双语对照、专业翻译记忆库、Linguee 的 Web 索引);加上欧洲数据中心、德国工程、GDPR 友好的合规故事,在欧洲企业市场切出了一块漂亮的根据地,订阅业务做得也很扎实。

护城河可以总结成两条:在窄任务上质量更好,加上一个干净的企业合规故事。这个护城河一直挺到2023年。

2024年开始漏水,现在已经干了。

护城河为什么破了

前沿通用大模型——GPT-4 这一代、Claude 这一代、Gemini 这一代——翻译只是它们「语言能力很强」的副产品。它们没有专门为翻译训练,但在大多数语种对、大多数应用场景里,BLEU 和 COMET 跟 DeepL 的差距小到四舍五入可以忽略——尤其是付费客户实际在做的那些活:公司邮件、合同、产品文案、知识库翻译。而且通用大模型灵活得多,翻译完顺手帮你重写、缩写、调语气、换语域、解释俚语,一次调用都能做。

Kutylowski 这两年在公开场合一直绕着不说的硬道理是:BLEU 优势就是护城河,BLEU 优势没了,剩下的商业楔子只有「我们是欧洲数据中心、GDPR 友好的翻译 API」。这个楔子是真的存在。但它撑不起一家1,000人的公司。

翻译,是第一个被通用大模型彻底吃掉的「AI 专才」品类。它不会是最后一个。图像生成专才公司是下一个;转录已经被 Whisper 加 GPT 后处理吃了一半;专业代码补全去年就被吃了。每一家「我们就把一件 AI 事情做到极致」的公司,现在都在和它们自己根本推不动的前沿模型升级跑步赛跑。

Kutylowski 在卖的转型故事:语音

伴随裁员一起公布的,有两件事:在旧金山新开办公室,以及收购 Mixhalo 团队——一家专做低延迟音频流的公司,创始人是 Incubus 乐队的 Mike Einziger。卖点是:DeepL 下一个守得住的产品是实时语音对语音翻译。Mixhalo 团队带来音频管线的基因;DeepL 自己有语言模型;两边合到一起,做出一个「延迟、音质、翻译准确度都对得上」、能在真实对话中能用的东西。

抽象地看,这个赌注是合理的。语音翻译里有一堆小工程问题——丢包、回声消除、说话人分离、延迟压在200毫秒以内——通用大模型不会自动给你解决,而 Mixhalo 这种音频专才团队是真的有优势。

但时机问题挺要命。OpenAI 的 GPT-4o realtime voice 和谷歌 Gemini Live,在它们自己的消费 App 里已经在做实时语音翻译了。比赛已经开始了。DeepL 大概有12到18个月的窗口期,把一个守得住的产品交付出来,赶在通用模型把语音翻译也吃掉之前。要么 Mixhalo + DeepL Voice 在延迟和音质上真的更好、楔子立得住;要么立不住,2027年我们大概会再聊一次「DeepL 这次又怎么了」。

重组话术,逐字翻译

Kutylowski 的原话值得照抄一遍:「更少的层级、更快的决策、把大团队浪费在反复沟通上的时间砍下去。」这套话术现在已经是「后 AI 时代」标配的重组黑话。过去六周里,完全一样的句子从 PayPal(4,760人)、Coinbase(约700人)、Freshworks(500人)、埃森哲(8.65亿美元重组、85,000人「转型或出局」)的发言稿里都说过一次。「AI 原生」这四个字现在是 CEO 词汇表里干活最多的一个,大致意思是:少一些中层、更多一线工作通过 AI 工具直接完成、用更小的团队产出同样或更高的活儿。

诚实版本是这样的:「前沿大模型存在这件事,让我们意识到自己之前其实超配了人手,毛利再被侵蚀之前必须把人头数砍下去。」这句话是真的。这个决定大概也是对的。只是它没有「更少的层级、更快的决策」体面,所以没人这么说。

底下还有一道欧洲 AI 的题

DeepL 是除了 Mistral 之外,欧洲最大的 AI 招牌。叙事原本是:欧洲可以靠欧洲数据、欧洲合规姿态、欧洲工程严谨,做出品类领先的 AI 公司。5月7日这250人的裁员,不算对这个叙事的彻底反驳,但是第一个高质量的反例数据点。让 DeepL 当年成为招牌的,是它 NMT 的质量优势;而把这个优势拿走的,是用了远超 DeepL 这辈子能融资到的算力训练出来的、来自美国的通用模型。

这给一批欧洲 AI 专才公司——TTS、图像、代码、文档理解、搜索——出了个题:在前沿模型一路碾过来的过程里,你们的护城河靠什么活下来。有些会撑住。但大多数撑不住。

接下来要看的几件事

  • Mixhalo 整合的时间线。 旧金山办公室加音频团队收购,都是慢输入。如果到年底 DeepL Voice 在延迟和音质上没有明显优于 GPT-4o realtime,这次转型就有麻烦了。
  • 企业订阅的留存率。 DeepL 的收入主要来自中型企业的翻译合同。「结构性转变」式的裁员往往伴随着客户在 AI 工具开支上做合并,把订单转向通用模型供应商。要看的数,是企业版的净留存率(NRR)。
  • 语种覆盖。 DeepL 历来在非欧语种(中、日、韩、阿)上偏弱。如果裁员后的路线图是「欧洲语种再加码,其他让给 OpenAI」,那它在向你提前剧透自己2028年长什么样。
  • 下一家做同样宣布的「AI 单一专才」公司。 套路已经定型——原本的护城河(专才质量)没了(被前沿模型抹平),应对动作是裁员加上一个「守得住的细分」转型。下一批要看转录、图像增强、AI 搜索。

一点干涩的尾声

5月7日那条领英帖最锋利的地方,是它没说的部分。Kutylowski 写了「AI 原生组织」、「结构性转变」、「更少的层级」。他没写那句最显然的话:「我们卖的 AI,已经不比别人手里的 AI 更好了,所以我们必须做一家更小的、做着不同事情的公司」。这句话其实就藏在帖子里,你读字里行间就读得出来。它必须在那里——不然数字根本算不平。

收购 Mixhalo 是真正有意思的那一手。裁250人是可以预料到的那一手。两手合起来,是一个 AI 专才被通用化抹平后的标准教科书打法——把人头数砍到匹配新的毛利率,买一支有不同护城河的团队,把剩下的工程师全部对准一个新的、守得住的产品,然后赶在前沿模型追上来之前把它做出来。

12到18个月。然后就知道答案了。