阿里通义开源网络智能体WebSailor
田宁
2025-07-07 17:17
7月7日消息,阿里通义正式开源网络智能体WebSailor,该智能体具备强大的推理和检索能力,发布后在智能体评测集BrowseComp上登顶开源网络智能体榜单。目前WebSailor的构建方案及部分数据集已在Github开源。

图源:阿里云公众号
WebSailor网络智能体可以应用复杂场景下的检索任务,对于模糊问题可迅速在不同的网页中进行快速检索并推理验证,从而在海量信息中通过严密的多步推理和交叉验证中最终得出检索答案。
同时,针对该智能体的训练,通义实验室团队采用了整套创新的post-training方法,大幅提升了该开源模型在复杂网页推理任务上的表现,在高难度智能体评测集BrowseComp上,WebSailor的成绩超越了DeepSeek R1、Grok-3等模型和智能体,一举登顶开源网络智能体榜单。
值得一提的是,近日,通义实验室首个音频生成模型ThinkSound也已正式开源,将打破“静音画面”的想象力局限。ThinkSound首次将CoT(Chain-of-Thought,思维链)应用到音频生成领域,让AI学会一步步“想清楚”画面事件与声音之间的关系,从而实现高保真、强同步的空间音频生成——不只是“看图配音”,而是真正“听懂画面”。

图源:“通义大模型”公众号
声明
1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn

田宁
电商脉搏,媒体前沿洞察。
推荐阅读