阿里发布千问Qwen3.5大模型 每百万Token低至0.8元

田宁
2026-02-21 17:16

2月21日消息,阿里巴巴近日开源全新一代大模型千问Qwen3.5-Plus,登顶全球最强开源模型。该模型总参数为3970亿,激活仅170亿,以小胜大,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。

目前,千问APP、PC端已接入Qwen3.5-Plus模型。开发者可在魔搭社区和HuggingFace下载新模型,同时可在阿里云百炼直接获取API服务。Qwen3.5-Plus的API价格每百万Token低至0.8元。

与前几代的千问大语言模型不同,千问3.5实现了从纯文本模型到原生多模态模型的代际跃迁。千问3预训练在纯文本Tokens上进行,而千问3.5则基于视觉和文本混合token上预训练,并大幅新增中英文、多语言、STEM和推理等数据,让张开“眼睛”的大模型学会了更密集的世界知识和推理逻辑,以不到40%的参数量获得超万亿的Qwen3-Max基座模型的顶尖性能,在推理、编程、Agent智能体等全方位基准评估中均表现优异。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:阿里云公众号

比如,千问3.5在MMLU-Pro认知能力评测中得分87.8分,超越GPT-5.2;在博士级难题GPQA测评中斩获88.4分,高于Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型纪录;而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,千问3.5表现均超越Gemini 3 Pro。

自2023年开源以来,阿里已开源400多个千问模型,覆盖全尺寸、全模态,千问全球下载量突破10亿次,单月下载量是DeepSeek、Meta、OpenAI、智谱、Kimi、MiniMax等2到8名总和,开发者基于千问开发的衍生模型超20万,是公认的全球第一开源模型,也是开发者最友好的开源大模型。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
5月8日消息,智能财税龙头企业百望股份与阿里云近日在北京签署全面战略合作协议,双方将继续深化云计算与数据智能融合,以模型为创新场景研发方向,联合成立“数据智能联合实验室”。同时,首个深度融合通义Qwen3(简称3)模型的财税行业垂类MCP服务已上线阿里云百炼MCP广场。
9月26日消息,阿里通义正式发布Qwen3-Omni。据通义介绍,Qwen3-Omni是原生全模态模型,预训练全模态不降智,并在36项音频及音视频基准测试中获32项开源SOTA与22项总体SOTA,超越Gemini-2.5-Pro、Seed-ASR、GPT-4o-Transcribe等闭源强模型
7月24日消息,阿里AI编程模型Qwen3-Coder发布后,引起全球AI广泛关注。北京时间7月24日,海外知名AI模型聚合平台OpenRouter发文强调,近两天来,阿里模型API调用量已突破500亿tokens。据了解,OpenRouter平台聚集了GPT、Gemini、Claude等全球多个顶尖语言模型,并对外提供统一的API服务。阿里Qwen3-Coder在代码能力及Agent调用能力方面取得重大突破,在多个Agent能力评测中超越GPT4.1、Claude4等顶级模型
该竞赛由三方机构Nof1于10月18日发起,集合Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4等全球六大顶尖模型,每个模型拥有一万美元初始资金,在真实市场上无人工干预地自主决策、交易,根据盈亏情况决出最后冠军。
10月15日消息,阿里通义语言模型负责人林俊旸在社交媒体上发文表示,Qwen3-VL推出了4B和8B两个版本,本周正式亮相。小型视觉语言(VL)模型非常适合部署使用,尤其在手机和机器人领域具有重要意义。过去小模型模型之间存在巨大的性能差距,而这次我们不仅提供了性能顶级的模型,同时也发布了能力接近模型的小模型。尤其令我惊讶的是,它们在小参数量下展现出的空间智能,我相信这将对具身智能(embodied AI)十分有帮助,并有望成为 Qwen2.5-VL的理想替代品。
11月27日消息,人工智能领域顶级会议NeurIPS2025正式开奖。今年会议一共接收5524篇论文,整体录用率为24.52%,最终全球仅4篇获得最佳论文。阿里通义团队在注意力机制上的最新研究成果成功斩获最佳论文奖。这篇论文在业内首次揭秘了注意力门控对模型性能和训练的影响,目前该研究已应用于Qwen3-Next模型
6月7日消息,阿里通义Qwen2模型今日发布,并在Hugging Face和ModelScope上同步开源。Qwen2系列涵盖5个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,上下文长度支持进一步扩展,最高达128K tokens。
2月13日消息,今年春节期间,不仅阿里国际站AI外贸产品帮商家接到了2000万美元的中东单,同时其已接入DeepSeek等先进模型,将全面应用于外贸生意的各个核心环节。接入后,AI在自动接待海外客户时,将能更全面地考虑买家询问的意图,然后结合阿里国际站上的市场洞察、外贸经验、商家商品的自身情况进行深度推理。此外,阿里国际站还在测试通义Qwen 2.5-Max模型,为商家提供服务。