林俊旸离职阿里后首发长文:智能体式思考将成为主流

刘峰
2026-03-27 10:30

3月27日消息,前阿里千问技术负责人林俊旸离职后首次发表长文,详细谈论了自己对大模型发展路线的理解及对AI下一阶段的预判。

林俊旸表示,过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI的o1表明,“思考”可以成为一种被训练出来的能力。DeepSeek-R1紧随其后,证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要。

但2025年上半年,行业焦点主要停留在“推理式思考”本身——如何让模型在推理的时候多想一会儿。现在该问下一步了,他的判断是智能体式思考——为了行动而思考,在与环境交互的过程中,并根据来自世界的反馈持续更新计划。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:X

林俊旸在文中深度剖析了行业内尝试“融合思考与指令模式”所面临的落地困境。他提到,2025年初,千问团队有一个很大的野心:做一个统一的系统,让思考模式和指令模式合二为一,支持可调节的推理努力程度(类似于低/中/高推理设置),甚至能根据提示词和上下文自动推断合适的推理量,让模型自主决定何时直接回答、何时稍作思考、何时为真正困难的问题投入大量计算。

概念上,这是正确的方向,但在实际推进中发现,指令模型追求极简与低延迟,而思考模型则需要消耗大量Token进行复杂推演,两者在数据分布和行为目标上存在根本冲突。若数据筛选不当,强行融合往往会导致模型在两端表现平庸,且比商业用户实际想要的成本更高。于是,2025年下半年,千问的2507版本就发了独立的Instruct和Thinking版本。

针对下一阶段的技术演进,林俊旸断言,单纯延长模型内部推理轨迹的时代即将过去,未来的主导将是在与环境交互中持续迭代计划的智能体思考。

公开资料显示,林俊旸年仅32岁,离职前是阿里巴巴最年轻的P10级技术负责人,也是通义千问核心推动者。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
年仅32岁,是阿里巴巴最年轻的P10级技术负责人。
3月4日消息,阿里大模型技术负责人自宣卸任,他在社交平台写道“me stepping down. bye my beloved qwen.”(我将卸任,再见我亲爱的)。作为阿里大模型的技术核心人物,或将离开团队,目前尚不知他是否会离开阿里巴巴。媒体就此消息向阿里巴巴求证,截至发稿暂未获得回复。
3月5日消息,谷歌DeepMind开发团队相关负责人Omar Sanseviero在社交平台喊话Qwen的朋友:“如果您想找个新地方来构建优秀的模型,并为开放模型生态系统做出贡献,请联系我们!我们的发展路线图上有很多令人兴奋的内容,未来还有很多工作要做。”今日,阿里巴巴批准通义实验室的辞职申请。
3月6日消息,针对近日网络流传阿里巴巴模型核心团队集体离职”“开源策略调整”等不实信息,阿里集团表示:目前模型团队稳定,没有出现“集体离职”的情况,所有产品与服务运行正常。基础模型团队从未被设置DAU等商业化KPI,Qwen大模型的目标是不断追求模型智能上限,实现AGI。阿里巴巴诚挚欢迎全球顶尖AI人才加入,共同打造世界级的大模型技术与开源生态。阿里巴巴将持续加大投入,为团队提供坚实支撑。
12月9日消息,据消息,阿里巴巴已成立C端事业群,由阿里巴巴集团副总裁吴嘉负责。阿里巴巴在内部沟通中提及,C端事业群的首要目标是将打造成为一款超级APP,成为AI时代用户的第一入口。未来,还将进一步把打造成无处不在的AI助手,覆盖眼镜、PC、汽车等场景,让每一个普通人都能随时随地使用AI,并持续从中受益。
阿里加入全球AI应用的顶级竞赛。
4月10日消息,从国家网信办官网获悉,为促进生成式人工智能服务创新发展和规范应用,网信部门会同相关部门按照《生成式人工智能服务管理暂行办法》要求,有序开展生成式人工智能服务备案工作,目前已有117个大模型完成这项工作。从公开信息可以看到,完成生成式人工智能服务备案的大模型包括中国移动九天、百度文心一阿里巴巴通义、华为云盘古、腾讯混元助手、OPPO安第斯、vivo蓝心等。
11月24日消息,阿里巴巴宣布,APP公测第一周即突破1000万下载。
7月22日消息,阿里巴巴通义更新旗舰版Qwen3模型,推出Qwen3-235B-A22B-FP8非思考模式 的更新版本。新的Qwen3模型通用能力明显提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard、BFCL等众多测评中表现出色,超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。
9月12日消息,阿里巴巴通义发布下一代基础模型架构Qwen3-Next,并开源了基于该架构的Qwen3-Next-80B-A3B系列模型。该结构相比Qwen3的MoE模型结构,进行了以下核心改进:混合注意力机制、高稀疏度MoE结构、一系列训练稳定友好的优化,以及提升推理效率的多token预测机制。