月之暗面突然出手,Kimi编程大模型拿下全球第一
不鸣则已,一鸣惊人。
一、Kimi 与 DeepSeek,狭路相逢的对手

图源:月之暗面GitHub项目
昨天,月之暗面向AI领域放了个大招。
它开源了 Kimi-Dev-72B编程大模型,这个仅有 72 亿参数的模型,在 SWE-bench 测试(AI编程能力测试)中以 60.4% 的成绩超越了DeepSeek-R1。

图源:月之暗面GitHub项目

图源:月之暗面GitHub项目
在此之前,5月28日发布的新版DeepSeek-R1凭借其 671 亿参数模型,曾是开源编程AI的标杆。如今,全球最强开源编程的宝座传到了kimi这里。
这场“以小博大” 的胜利,打破了行业对 “参数即性能” 的固有认知。
Kimi-Dev-72B有这样的成绩,原因在于三个秘密武器。
第一个武器是双角色设计。

图源:月之暗面GitHub项目
AI可以同时扮演“Bug 修复者” 与 “测试编写者”。
简单说就是能自己检查代码,自己验证修复是否正确。这样通过强化学习让模型在自我验证中进化。
第二个武器是强化学习优化。
AI能通过“试错”方式训练,只有真正修复了Bug并通过测试,才会得到奖励,确保AI的解决方案可靠。
第三个武器是高效的数据训练。
Kimi-Dev-72B用了1500亿条高质量GitHub代码数据,用定向训练更让其直击实际开发痛点。
通过这三个武器,Kimi-Dev-72B可以在代码修复、测试编写的精准度上占据优势,弥补和DeepSeek-R1在参数量上的差距。
对比kimi,DeepSeek-R1的技术路线更偏向通用编程,在数学推理等领域仍保持优势,但面对企业级代码修复需求时,Kimi-Dev-72B 的实战化训练明显更胜一筹。
这种技术路线的差异,本质是“大而全” 与 “专而精” 的战略分野。

图源:中国日报
时间拨回 2024 年,Kimi 的崛起堪称营销教科书。
一般来说,大模型的应用分为B端和C端,前者是指面向企业或机构的商业应用,后者则是面向普通消费者的个人应用。
当国产大模型扎堆 B 端时,kimi以“200 万字上下文窗口” 切入 C 端,成为论文翻译、法律文档解析的办公神器,深受个人消费者的青睐。
Kimi的市场优势,加上一个月就高达1.99 亿的广告投放,终于在去年11月砸出 1282 万月活,环比增长28%,在百度文心一言、阿里通义千问的夹击中杀出第三条路,仅次于百度文小言位居行业第二。
但 2025 年 DeepSeek 的横空出世完全颠覆了游戏规则。
凭借极低的训练成本和极高的性能表现,DeepSeek爆火出圈、震惊整个行业,零广告投入却靠技术口碑实现 1.25 亿用户增长,七天内收割 1 亿新用户,让行业看清了技术穿透力的真正威力。
此时的DeepSeek被称为“AI流量黑洞”。
而kimi的挑战还没结束。
3月下旬,腾讯元宝宣布完成重磅更新:同时接入DeepSeek V3-0324最新版,以及深度思考模型混元T1正式版。
腾讯财大气粗,广告投入比kimi只多不少。
今年一季度,AI产品的全行业投流费用约为18.4亿元,而腾讯元宝占比高达76%,仅在3月份,腾讯元宝投放费用达到11亿元。

图源:QuestMobile
QuestMobile 数据显示,2025 年 3 月 DeepSeek 以 1.9 亿月活登顶,腾讯元宝月活规模为0.4亿,而 Kimi月活数量仅为0.18亿。
Kimi 的滑落不仅是数字变化,更揭示了 C 端市场的底层逻辑变迁:
当 AI 从 “新奇工具” 变为 “基础设施”,用户选择的核心标准已从 “营销声量” 转向 “技术体验”。
DeepSeek 的杀手锏之一是开源策略。其低成本模型不仅降低了企业接入门槛,更通过开发者生态快速积累用户。
当 DeepSeek-R1 成为行业标杆时,月之暗面终于在 2025 年 6 月调整策略,以 MIT 协议开源 Kimi-Dev-72B,允许商业使用。
这种转变揭露了残酷的现实,在 AI 时代,技术优势若不能转化为生态优势,终将被开源浪潮淹没。
二、Kimi 与月之暗面坎坷的发展历程
月之暗面这家 2023 年 4 月成立的 AI 公司,背后站着豪华的资本阵容。
从 2024 年 B 轮融资 25 亿美元,有阿里、腾讯等参投,到 2025 年估值升至 30 亿美元,美团、小红书加入,月之暗面的融资速度堪比火箭。

图源:虎嗅网
创始人杨植麟作为清华天才少年,带领曾任职谷歌、Meta 的核心团队,构建了从长文本处理到多模态推理的技术护城河。
但资本加持也带来压力。
当 DeepSeek 以更低成本实现技术突破,月之暗面不得不重新审视商业化路径。
月之暗面B 端依赖 API 接入、C 端靠打赏模式的现状亟待改变,其接收小米“Kimi” 商标转让、与华为合作搭载鸿蒙系统等动作,就是想在 DeepSeek 的压力下寻找新的盈利支点。

图源:天眼查

图源:月之暗面kimi微博
从 2023 年 10 月支持 20 万字处理的 Kimi Chat,到 2025 年 1 月超越 GPT-4 的 k1.5 多模态模型,Kimi 的技术进化从未停歇。
但真正的战略转向发生在今年:
4 月份内测内容社区,模仿小红书设计打造 AI 生成内容生态;
在6 月初开源编程模型,试图通过开发者生态破局。
这种从“工具” 到 “平台” 的转型,本质是应对 DeepSeek 冲击的非对称策略。
当AI 生成内容(AIGC)成为趋势,Kimi 不再局限于工具属性,而是要做内容分发平台。
在平台上可以用AI 抓取全网热点,kimi还邀请了邀请科技财经频道号入驻,这些动作直指 DeepSeek 技术强大但应用场景单一的短板。

图源:月之暗面kimi微博
换句话说,kimi的战略是,既然无法在开源技术上短期超越DeepSeek,就通过应用创新建立差异化优势。
不仅如此,月之暗面还在经历一场战略加减法。
减法是减少广告投放,将资源从营销转向技术。Kimi将模型推理服务降价 83%,用性价比争夺企业客户;
加法是聚焦垂直场景。Kimi 被清华北大纳入学术诚信工具包,在法律、教育领域深化应用。
但这样还不够,尚未盈利的月之暗面需要向投资人证明付费潜力,而 C 端用户对 AI 工具的付费意愿尚未完全打开。
内容社区能否通过广告、打赏实现变现?开源模型能否通过企业服务盈利?
这些问题的答案,将决定月之暗面能否在 DeepSeek 与阿里、腾讯等巨头的夹击中存活下来。
三、AI 时代的生存法则

图源:微博
Kimi 与 DeepSeek 的较量,本质是中国 AI 大模型行业的一个缩影。
在技术突破与商业落地的双重压力下,月之暗面的反击揭示了三个关键生存法则:
首先,技术专精度胜过参数规模。
Kimi-Dev-72B 用 72 亿参数超越 671 亿参数模型的案例证明,谁能解决具体行业痛点,谁就能掌握主动权。
其次,生态构建能力决定生存空间。
DeepSeek 的崛起印证了开源生态的力量,而 Kimi 的反击也显示闭源企业必须找到生态破局点。
无论是内容社区还是硬件集成,本质都是在构建“技术 - 应用 - 用户” 的闭环,单靠技术优势难以维持长期竞争力。
最后,非对称创新创造突围机会。
当 DeepSeek 在技术层面对标 GPT-4,Kimi 选择从应用层突破,结合了内容社区、硬件集成、行业解决方案,这些非对称策略让其在巨头夹缝中找到生存空间。
AI 行业的竞争从来不是线性比拼,而是多维战场的立体博弈。
站在 2025 年的时间节点,月之暗面的反击才刚刚开始。这家年轻的 AI 公司能否完成从 “黑马” 到 “长跑者” 的蜕变,还有待观瞻。
而对于整个行业而言,这场较量的终极意义或许在于,倒逼中国 AI 企业跳出 “复制国外路径” 的惯性,走出一条 “技术创新 + 生态重构 + 商业落地” 的独特道路。
在这条充满不确定性的赛道上,唯一能够确定的是,竞争从未如此激烈,机遇也从未如此临近。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
