AI 圈大瓜:Cursor 的"自研"Composer 2,竟然是 Kimi K2.5 套壳?

cover

3 月 19 日,Cursor 高调发布了新模型 Composer 2。

官方博客写得很漂亮——“首次对基座模型进行继续预训练,再结合大规模强化学习”。言下之意:这是我们自己练出来的。

结果不到 24 小时,就被人扒了个底朝天。

一个开发者在调试 API 的时候,发现了一个不该出现的东西:kimi-k2p5-rl-0317-s515-fast

这不是 Cursor 的模型名字。这是月之暗面的 Kimi K2.5。

AI 圈,又炸了。

一个模型 ID,引爆一场风暴

事情是这样的。

3 月 19 日,Cursor 发布 Composer 2,宣称是迄今为止最强的自研编程模型。在 Terminal-Bench 2.0 上拿到了 61.7% 的得分,超过了 Claude Opus 4.6 的 58.0%。定价也很诱人——每百万输入 token 只要 0.5 美元。

看起来,一切都很美好。

然而第二天,一位叫 Fynn 的开发者(@fynnso),在测试 Cursor 的 OpenAI 兼容接口时,无意间看到了 API 返回的模型 ID:

1
accounts/anysphere/models/kimi-k2p5-rl-0317-s515-fast

这串字符的含义,搞 AI 的人一眼就能看懂:

  • anysphere —— Cursor 的母公司
  • kimi-k2p5 —— Kimi K2.5,月之暗面的开源模型
  • rl —— 强化学习
  • 0317 —— 训练日期,3 月 17 日
  • fast —— 推理加速版本

翻译一下:Cursor 拿了 Kimi K2.5,在上面做了 RL 微调,然后改了个名字叫 Composer 2。

这条推文发出后,24 小时内阅读量超过 44 万。

月之暗面的愤怒

消息传开后,月之暗面的预训练负责人杜羽伦(Yulun Du)第一时间在社交媒体上发声。

他说团队测试了 Composer 2 的 tokenizer,发现”跟我们 Kimi 的 tokenizer 完全一致”。他直接 @ 了 Cursor 联合创始人 Michael Truell,质问:

“为什么不尊重我们的许可证?为什么一分钱都没付?”

这就牵出了一个关键问题——许可证。

Kimi K2.5 采用的是修改版 MIT 协议。核心条款很明确:

如果你的商业产品月活超过 1 亿,或者月营收超过 2000 万美元,你必须在用户界面上显著标注”Kimi K2.5”。

那 Cursor 触发了这个条款吗?

来看几个数字:

指标 数值
估值 293 亿美元
年化营收 约 20 亿美元
月营收 约 1.67 亿美元
许可证阈值 月营收 2000 万美元

Cursor 的月营收是许可证阈值的 8 倍多。

但 Cursor 的界面上,写的是”Composer 2”。没有任何地方提到 Kimi K2.5。

反转来了:其实是”合法合作”?

就在大家以为要打官司的时候,剧情反转了。

3 月 20 日,Kimi 官方账号发了一条推文:

“恭喜 @cursor_ai 团队发布 Composer 2!我们很自豪看到 Kimi K2.5 提供了基础。Cursor 通过 @FireworksAI_HQ 的推理平台访问 Kimi K2.5,这是经过授权的商业合作。”

Cursor 也终于承认了:

“是的,Composer 2 基于开源基座模型。最终模型大约只有 1/4 的算力来自基座,剩下 3/4 是我们自己的训练。所以评测结果差异很大。”

同时,Cursor 也承认了一个问题:

“同意大家的反馈,我们应该一开始就说明基座模型来源。下一个模型我们会这样做。”

好家伙。意思就是:用了,但没说。被抓了,才承认。下次注意。

这事为什么值得关注

你可能会说:既然最后确认是合法合作,那不就没事了吗?

没那么简单。这件事暴露了好几个值得深思的问题。

1. “自研”的含义被稀释了

Cursor 发布 Composer 2 时,用的表述是”首次对基座模型进行继续预训练”。

这话技术上没毛病——继续预训练和 RL 确实是施加在某个基座之上的。但问题是,你刻意不提基座是谁的,就会让人以为你从头到尾都是自己做的。

这就像你买了一辆特斯拉的白车身,重新喷漆、改装内饰、换了发动机,然后告诉大家”这是我自己造的车”。

技术上你确实做了大量工作。但消费者的理解是不一样的。

2. 开源许可证的考验

Kimi K2.5 是万亿参数的 MoE 架构模型,384 个专家,每个 token 只激活 3.2% 的参数。月之暗面把这样一个模型开源出来,本身就是对社区的巨大贡献。

他们唯一的要求是:如果你用它赚大钱了,请标注来源。

这个要求过分吗?一点也不。

但如果没有 @fynnso 那次偶然的 API 调试,这个标注可能永远不会出现。

这给所有开源模型作者敲响了警钟:你写了许可证,不代表别人会遵守。你需要技术手段来保护自己。

3. 用户知情权

Cursor 的付费用户每月花 20 美元订阅 Pro 版。他们以为自己在用 Cursor 的自研模型,实际上用的是 Kimi K2.5 + RL。

这重要吗?

如果模型效果好,也许用户不在乎底层是什么。但透明度本身就是一种信任。你今天不说基座模型来源,明天会不会不说训练数据来源?后天会不会不说安全审计结果?

信任是一点一点建立的,也是一点一点失去的。

AI 行业的”套壳”问题

其实,Cursor 不是第一个这样做的。

有传闻说,Cursor 之前的 Composer 1 系列可能也基于 GLM 4.x。但 GLM 用的是标准 MIT 协议,没有标注要求,所以没有法律问题。

这次的区别在于:Kimi K2.5 的许可证明确要求标注,而 Cursor 没有标注。

在开源 AI 的生态里,”拿来主义”本身没有问题。开源的意义就在于让所有人都能使用和改进。但”拿来不说”就是另一回事了。

这也反映了 AI 行业的一个尴尬现实:很多所谓的”自研”,其实都站在开源模型的肩膀上。 这本身不丢人,但你得说出来。

就像 Hacker News 上有人评论的:”现在靠重新包装开源模型就能赚大钱。”

一针见血。

后续影响

这件事虽然以”和解”告终,但影响深远。

对 Cursor: 短期信誉受损,但技术能力依然在线。他们在 Kimi K2.5 基础上做的 RL 训练确实有效果,Composer 2 的编程能力是实打实的。只是以后发布新模型时,恐怕不敢再含糊其辞了。

对月之暗面: 这波反而是大赢特赢。全世界都知道了——一个估值 293 亿美元的硅谷明星公司,选择了你的模型作为基座。这比任何广告都管用。

对开源社区: 修改版 MIT 协议经受住了考验。社区压力 + 许可证条款,成功让一家巨头公司承认并遵守了规则。但大家也看到了,这个过程不是自动的——需要有人发现,有人发声。

对开发者: 你用的 AI 编程工具,底层到底是什么模型?你可能永远不知道。但这件事告诉我们:保持好奇心,偶尔戳一戳 API,你可能会发现有趣的东西。

写在最后

AI 行业发展太快,快到很多规则还没来得及建立。

开源模型的许可证、商业使用的透明度、用户的知情权——这些问题会越来越频繁地出现。

Cursor 这次的事情,结局算是好的。双方和解,许可证得到尊重,用户也知道了真相。

但下一次呢?

不是每个开源作者都有月之暗面的影响力,不是每次都有开发者恰好去调试 API。

在这个 AI 大模型遍地开花的时代,我们需要的不只是更强的模型,还需要更透明的规则。

你怎么看这件事?你觉得 AI 公司用开源模型做商业产品,标注来源应该是”道德要求”还是”法律义务”?欢迎在评论区聊聊你的看法。