美团上线首个开源“重思考”模型

刘峰
2026-01-16 17:15

1月16日消息,美团LongCat团队正式对外发布并开源LongCat-Flash-Thinking-2601。作为已发布的LongCat-Flash-Thinking模型的升级版,LongCat-Flash-Thinking-2601在Agentic Search(智能体搜索)、Agentic Tool Use(智能体工具调用)、TIR(工具交互推理)等核心评测基准上,均达到开源模型SOTA水平。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:龙猫LongCat公众号

该模型尤其在工具调用上表现出卓越的泛化能力,在依赖工具调用的随机复杂任务中性能超越了Claude,可大幅度降低真实场景下新工具的适配训练成本;同时它是首个完整开源并支持在线免费体验“重思考模式”的模型,同时启动8个大脑飞速运转,确保思考周全、决策可靠。

美团介绍,全新升级的“重思考”模式,让模型学会了“深思熟虑”再行动,遇到高难度问题时,模型会把思考过程拆成并行思考和总结归纳两步来做:一是并行思考阶段,模型会同时独立梳理出好几条推理路径,就跟人面对难题时会琢磨不同解法一个道理,还会特意保证思路的多样性,生怕漏掉最优解;二是总结归纳阶段,对多条路径进行梳理、优化与合成,并将优化结果重新输入,形成闭环迭代推理,推动思考持续深化。

除此之外,美团还专门设计了额外的强化学习环节,针对性打磨模型的总结归纳能力,让LongCat-Flash-Thinking-2601真正实现“想清楚再行动”。经过全面严谨的评估显示,LongCat-Flash-Thinking-2601模型在编程、数学推理、智能体工具调用、智能体搜索维度表现全面领先。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:龙猫LongCat公众号

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
“问小”除了搭载自研的LongCat模型,还根据不同用户需求综合了多种主流模型
1月22日消息,App更新到了12.51.202版本,新版本上线“问小AI搜索功能,用户在搜索商家、商品时使用此功能,即可快速获取真实准确的决策信息,更便捷找到吃喝玩乐好去处、发现更优惠的商品和服务、免口令一键领券。同时,新版本App也升级了相关横幅广告,从“美好生活小帮手”更新为“问,都安排”。据悉,“问小”除搭载自研的LongCat 模型,还根据不同用户需求,综合了多种主流模型,能够更好地完成不同任务。
12月11日消息,据消息,前闪极AI合伙人、前字节视觉模型AI平台负责人潘欣近期已经加入,负责多模态AI创新工作,主导了LongCat App等多个相关应用的开发。潘欣曾任谷歌大脑研究员,推动TensorFlow动态图模式开发。回国后,他先后在百度、腾讯与字节跳动任职。2024年11月,潘欣加入闪极科技,担任AI合伙人,整体负责AI技术研发及智能眼镜项目。
9月12日消息,首款AI Agent产品“小”APP官宣开展公测。“小”搭载了自研模型LongCat-Flash-Chat ,通过简单的自然语言交互、内部接口调用,能够实现原生、丝滑的外卖下单、餐厅推荐、订座导航等本地生活服务体验。目前,“小”APP在主流应用商店均已上架,用户可通过“小”官方账号不定期发放的专属邀请码参与公测。
2月11日消息,LongCat发布原生“深度研究”Agent(智能体)。基于独创三层智能体闭环架构及积累的物理世界数据训练,该产品有效缓解了当前AI在解决真实物理世界问题时容易出现幻觉的痛点。用户盲测显示,其攻略“整体可用率”达61.1%,优于ChatGPT的42.8%。目前该功能已在LongCat网页免费开放。
AI最新进展发布。
9月5日消息,继9月1日发布并开源模型龙猫后,AI领域加速布局,即将上线聚焦本地生活服务智能推荐的AI搜索,目前该功能已进入内测阶段。这一动态不仅是AI技术落地的又一重要节点,更标志着其“AI+本地生活”战略进一步向核心业务场景渗透。
1月19日消息,据报道,现任AI平台视觉中心负责人魏晓林将离职,结束长达4年6个月的生涯。目前,其领英个人认证尚未做出更改。在魏晓林的带领下,AI平台视觉中心开发并部署了数千个AI API和SDK,目前广泛应用于App和大众点评App的内容审核、内容创建、搜索、广告、推荐系统和移动AR。他还组织研发了部署在自动配送车队、用于自动驾驶的高性能CV模型,以及地图街景自动处理和自动更新的管道。
3月3日消息,旗下光年之外(GN06)团队近日宣布,其全新产品Tabbit AI浏览器进入公测。产品发布后,有用户在社交网络发帖称Tabbit AI浏览器抄袭了自己的代码,并列出相关代码截图。对于上述情况,Tabbit AI浏览器官方回应称:充分尊重和理解原作者对项目的所有权及其协议选择,将从Tabbit浏览器新版中移除此项目。