首页
快讯
观察
Toggle theme
美团LongCat发布数学推理评测基准AMO-Bench
2025-11-18 11:41:28
分享
11月18日消息,美团LongCat团队日前发布数学推理评测基准—— AMO-Bench 。该评测集共包含50道竞赛专家原创试题,所有题目均对标甚至超越IMO竞赛难度。
[查看原文]
更加详细情况,请关注本站最新动态。
7X24h快讯
可灵AI推出会员模型优惠计划
18分钟前
抖音生活服务组织调整 今年目标超越美团
2小时前
云汉芯城:首席技术官钱波因个人原因辞职
2小时前
苏宁易购预计今年开展2000场国补社区行活动
2小时前
笨鸟速运完成全头部电商平台系统对接
2小时前
京东云上线ClawLab用户AI助手
3小时前
QQ成为国内首个被OpenClaw官方原生接入的社交平台
3小时前
顺丰航空开通“鄂州=巴黎”国际货运航线
3小时前
1688获“驰名商标”司法认定,有效降低中小企业合规成本
3小时前
新石器向巴南邮政交付新一批无人车
4小时前