阿里通义开源网络智能体WebSailor

田宁
2025-07-07 17:17

7月7日消息,阿里通义正式开源网络智能体WebSailor,该智能体具备强大的推理和检索能力,发布后在智能体评测集BrowseComp上登顶开源网络智能体榜单。目前WebSailor的构建方案及部分数据集已在Github开源。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:阿里云公众号

WebSailor网络智能体可以应用复杂场景下的检索任务,对于模糊问题可迅速在不同的网页中进行快速检索并推理验证,从而在海量信息中通过严密的多步推理和交叉验证中最终得出检索答案。

同时,针对该智能体的训练,通义实验室团队采用了整套创新的post-training方法,大幅提升了该开源模型在复杂网页推理任务上的表现,在高难度智能体评测集BrowseComp上,WebSailor的成绩超越了DeepSeek R1、Grok-3等模型和智能体,一举登顶开源网络智能体榜单。

值得一提的是,近日,通义实验室首个音频生成模型ThinkSound也已正式开源,将打破“静音画面”的想象力局限。ThinkSound首次将CoT(Chain-of-Thought,思维链)应用到音频生成领域,让AI学会一步步“想清楚”画面事件与声音之间的关系,从而实现高保真、强同步的空间音频生成——不只是“看图配音”,而是真正“听懂画面”。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:“通义大模型”公众号

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
7月5日消息,阿里通义大模型”公众号发文宣布,通义实验室首个音频生成模型ThinkSound现已正式开源,将打破“静音画面”的想象力局限。ThinkSound首次将CoT应用到音频生成领域,让AI学会一步步“想清楚”画面事件与声音之间的关系,从而实现高保真、强同步的空间音频生成——不只是“看图配音”,而是真正“听懂画面”。
6月10日消息,据通义大模型微信公众号,阿里巴巴通义实验室发布并开源了MaskSearch预训练框架,让AI学会“主动搜索+多步推理”,从而更准确、更智能地回答复杂问题。
4月2日消息,全球最大的AI开源社区Hugging Face更新了大模型榜单,阿里通义千问近期开源的端到端全模态大模型Qwen2.5-Omni登上总榜榜首,DeepSeek-V3-0324和群核的SpatialLM-Llama-1B紧随其后,杭州公司霸榜全球开源模型榜单前三。
3月28日消息,阿里通义千问正式推出QVQ-Max视觉推理模型的第一版。这一新版本的模型具备强大的多模态处理能力,它不仅能够“看懂”图片和视频里的内容,还能结合这些信息进行分析、推理,甚至给出解决方案。从数学题到生活小问题,从编程代码到艺术创作,QVQ-Max都表现出了不俗的能力。
3月26日消息,阿里通义千问与DeepSeek均于昨日低调开源了两款新模型。阿里发布了更适合本地部署的高性能“多模态模型”Qwen2.5-VL-32B,DeepSeek则将此前热门的“基座模型”V3更新到0324版本,并官宣在魔搭社区上架开源。截至目前,魔搭社区模型总数已超4万个,已成为中国最大的AI开源社区。
鄢志杰曾担任达摩院机器智能语音实验室负责人,是达摩院的十三位“扫地僧”之一(最初的核心成员)。
3月7日消息,全球最大的AI开源社区Hugging Face更新了大模型榜单,近日刚发布并开源的阿里通义千问推理模型QwQ-32B成功登顶。据了解,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,用更小参数实现整体性能比肩DeepSeek-R1,并突破性地让高性能推理模型在消费级显卡上实现本地部署,大幅降低了模型应用成本。2023年至今,阿里已向全球开源200多款模型。截至目前,海内外AI开源社区中的千问大模型的衍生模型数量已突破10万,成为全球最大的开源模型族群。
田宁
电商脉搏,媒体前沿洞察。