美团上线首个开源“重思考”模型

刘峰
2026-01-16 17:15

1月16日消息,美团LongCat团队正式对外发布并开源LongCat-Flash-Thinking-2601。作为已发布的LongCat-Flash-Thinking模型的升级版,LongCat-Flash-Thinking-2601在Agentic Search(智能体搜索)、Agentic Tool Use(智能体工具调用)、TIR(工具交互推理)等核心评测基准上,均达到开源模型SOTA水平。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:龙猫LongCat公众号

该模型尤其在工具调用上表现出卓越的泛化能力,在依赖工具调用的随机复杂任务中性能超越了Claude,可大幅度降低真实场景下新工具的适配训练成本;同时它是首个完整开源并支持在线免费体验“重思考模式”的模型,同时启动8个大脑飞速运转,确保思考周全、决策可靠。

美团介绍,全新升级的“重思考”模式,让模型学会了“深思熟虑”再行动,遇到高难度问题时,模型会把思考过程拆成并行思考和总结归纳两步来做:一是并行思考阶段,模型会同时独立梳理出好几条推理路径,就跟人面对难题时会琢磨不同解法一个道理,还会特意保证思路的多样性,生怕漏掉最优解;二是总结归纳阶段,对多条路径进行梳理、优化与合成,并将优化结果重新输入,形成闭环迭代推理,推动思考持续深化。

除此之外,美团还专门设计了额外的强化学习环节,针对性打磨模型的总结归纳能力,让LongCat-Flash-Thinking-2601真正实现“想清楚再行动”。经过全面严谨的评估显示,LongCat-Flash-Thinking-2601模型在编程、数学推理、智能体工具调用、智能体搜索维度表现全面领先。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:龙猫LongCat公众号

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
12月11日消息,据消息,前闪极AI合伙人、前字节视觉模型AI平台负责人潘欣近期已经加入,负责多模态AI创新工作,主导了LongCat App等多个相关应用的开发。潘欣曾任谷歌大脑研究员,推动TensorFlow动态图模式开发。回国后,他先后在百度、腾讯与字节跳动任职。2024年11月,潘欣加入闪极科技,担任AI合伙人,整体负责AI技术研发及智能眼镜项目。
9月12日消息,首款AI Agent产品“小”APP官宣开展公测。“小”搭载了自研模型LongCat-Flash-Chat ,通过简单的自然语言交互、内部接口调用,能够实现原生、丝滑的外卖下单、餐厅推荐、订座导航等本地生活服务体验。目前,“小”APP在主流应用商店均已上架,用户可通过“小”官方账号不定期发放的专属邀请码参与公测。
AI最新进展发布。
9月5日消息,继9月1日发布并开源模型龙猫后,AI领域加速布局,即将上线聚焦本地生活服务智能推荐的AI搜索,目前该功能已进入内测阶段。这一动态不仅是AI技术落地的又一重要节点,更标志着其“AI+本地生活”战略进一步向核心业务场景渗透。
1月19日消息,据报道,现任AI平台视觉中心负责人魏晓林将离职,结束长达4年6个月的生涯。目前,其领英个人认证尚未做出更改。在魏晓林的带领下,AI平台视觉中心开发并部署了数千个AI API和SDK,目前广泛应用于App和大众点评App的内容审核、内容创建、搜索、广告、推荐系统和移动AR。他还组织研发了部署在自动配送车队、用于自动驾驶的高性能CV模型,以及地图街景自动处理和自动更新的管道。
10月31日消息,“智能掌柜”全面升级餐饮门店AI电话接待能力,通过语义识别、对话分析等模型的应用,优化堂食服务体验,同时帮助中小餐饮商家发现新商机。数据显示,10月份,AI接待”已促成近15万堂食消费订单。表示,接下来,还会有其他功能的优化更新,让智能掌柜更加适配餐饮业实际经营场景,持续帮助餐饮人接入AI时代。
近期上线了“袋鼠参谋”“袋鼠管家”等多款AI经营工具,可提供开店选址、菜品研发、智能装修等功能。
6月7日消息,一款面向用户的AI外卖助手米鲁已经上线外卖。在米鲁的自我介绍中,它的英文名字叫Miru,日语中意为看,其中的M,代表Meituan(),也有Muse、Magical的含义。米鲁可以根据用户不同的需求来推荐周边美食,主要包括:价位、餐厅、菜品菜系、口味偏好和配送时长。