蚂蚁集团正式发布并开源万亿参数思考模型Ring-1T

刘峰
2025-10-14 11:45

10月14日消息,蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。Ring-1T在9月30日开源的预览版Ring-1T-preview基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:蚂蚁集团

为了持续激发Ring-1T的数学等复杂推理能力,此次百灵团队挑战了难度更高的IMO2025(国际数学奥利匹克)赛题,将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T仅用一次解出了第1、3、4、5题,相当于IMO银牌水平,成为首个能拿IMO国际奥数奖的开源系统。

作为一款思考模型,Ring-1T也表现出了极佳的通用能力,在“人类偏好对齐”测试Arena-Hard V2中,Ring-1T以81.59的成功率居于开源模型榜首,逼近GPT-5-Thinking(High)82.91的成绩。在面向严谨领域的医疗问答HealthBench测评中,Ring-1T也以最高分取得开源领域最佳。

据百灵团队透露,Ring-1T模型是其在万亿思考模型上的首次尝试,蚂蚁百灵团队会在后续的版本中继续完善模型性能。目前,用户可通过HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。

截至目前,蚂蚁百灵大模型已经发布18款模型,已形成从160亿总参数到1万亿总参数的大语言模型产品矩阵,其中两款万亿参数模型—万亿参数通用大语言模型Ling-1T、万亿参数思考模型Ring-1T。随着两款万亿参数模型的发布,百灵大模型也正式步入2.0阶段。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:蚂蚁集团

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
11月6日消息,根据国家七部委联合公布的《生成式人工智能服务管理暂行办法》指导要求,蚂蚁百灵模型已完成备案,基于百灵模型的多款产品已陆续完成内测,将向公众开放。本次通过备案的是蚂蚁百灵语言模型,该模型采用Transfromer架构,基于万亿级Token语料训练而成,支持窗口长度达32K。
基于蚂蚁百灵模型的AI应用支小宝团队也在近期面临团队人员调整。
12月29日消息,“2023模型落地应用案例集”正式发布,蚂蚁集团4项实践入选。本次入选的4项应用分别是:遥感模型在农业信贷场景的应用、数据分析智能助理DeepInsight Copilot、金融专家智能助理支小助、模型数据高质量供给平台。据了解,这4项应用都是基于蚂蚁百灵模型,今年11月,百灵模型已完成备案。
NextEvo是蚂蚁内部的AI精锐部门,承担了蚂蚁AI的所有核心技术研发,包括蚂蚁百灵模型的所有研发工作。
1月24日消息,蚂蚁集团已在内部成立了AI创新研发与应用部门NextEvo,由蚂蚁集团副总裁徐鹏担任负责人。NextEvo是蚂蚁内部的AI精锐部门,承担了蚂蚁AI的所有核心技术研发,包括蚂蚁百灵模型的所有研发工作。2023年,该部门发表了30余篇AI国际顶刊顶会论文。NextEvo开源的智能大规模分布式深度学习系统DLRover,以及GPU显存+传输优化开源项目GLake弥补了国内所在AI垂直领域技术开源的空缺。
7月24日消息,蚂蚁集团智能体开发平台“百宝箱”正式推出企业版。这一新版本面向文旅、出行、会展、高校、零售、餐饮等服务业场景,提供蚂蚁百灵模型、通义千问模型、DeepSeek等主流模型的一站式接入,并配套支付MCP、营销MCP等支付宝特色能力。据了解,2025年内百宝箱企业版计划覆盖1000家以上行业客户。
9月18日消息,硅基流动模型服务平台首发上线蚂蚁集团百灵团队最新开源的Ling-flash-2.0。硅基流动平台上线的Ling-flash-2.0支持128K最大上下文长度,价格为输入1元/M Tokens,输出4元/M Tokens。
9月10日消息,硅基流动宣布其模型服务平台已首发上线蚂蚁集团百灵团队最新开源的Ling-mini-2.0。该模型拥有16B总参数,但每Token仅激活1.4B参数(non-embedding 789M)。硅基流动平台上线的Ling-mini-2.0支持128K最大上下文长度,价格为输入0.5元/M Tokens,输出2元/M Tokens。