阿里发布并开源全新推理模型通义千问QwQ-32B

田宁
2025-03-06 09:38

3月6日消息,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
11月28日消息,阿里通义团队发布全新AI推理模型QwQ-32B-Preview,同步开源。评测数据显示,预览版本的QwQ,已展现出研究生水平的科学推理能力,在数学和编程方面表现尤为出色,整体推理水平比肩OpenAI o1。
10月20日消息,2021云栖大会上,阿里云正式发布全新操作系统“龙蜥”宣布开源,同时,阿里达摩院操作系统实验室也宣告成立。未来,阿里云计划为龙蜥投入20亿专项资金,联合100家生态合作伙伴推动生态建设,提供至少十年技术支持。据了解,龙蜥操作系统定位于服务器端,支持X86、ARM等多种芯片架构和计算场景,在阿里巴巴内部打磨10年,有效支撑了历年天猫双11,性能和稳定性都经受住了严苛的考验。
6月10日消息,据通义大模型微信公众号,阿里巴巴通义实验室发布开源了MaskSearch预训练框架,让AI学会“主动搜索+多步推理”,从而更准确、更智能地回答复杂问题。
3月7日消息,全球最大的AI开源社区Hugging Face更新了大模型榜单,近日刚发布开源阿里通义推理模型QwQ-32B成功登顶。据了解,QwQ-32B在数学、代码及通用能力上实现质的飞跃,用更小参数实现整体性能比肩DeepSeek-R1,突破性地让高性能推理模型在消费级显卡上实现本地部署,大幅降低了模型应用成本。2023年至今,阿里已向全球开源200多款模型。截至目前,海内外AI开源社区中的大模型的衍生模型数量已突破10万,成为全球最大的开源模型族群。
6月7日消息,阿里通义Qwen2大模型今日发布在Hugging Face和ModelScope上同步开源。Qwen2系列涵盖5个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,上下文长度支持进一步扩展,最高达128K tokens。
3月26日消息,阿里通义与DeepSeek均于昨日低调开源了两款新模型。阿里发布了更适合本地部署的高性能“多模态模型”Qwen2.5-VL-32B,DeepSeek则将此前热门的“基座模型”V3更新到0324版本,官宣在魔搭社区上架开源。截至目前,魔搭社区模型总数已超4万个,已成为中国最大的AI开源社区。
5月22日消息,由阿里国际联合上海人工智能实验室、北京语言大学一起制定的AI翻译测评榜单TransBench在OpenCompass上线。与传统的翻译测评体系相比,增加了幻觉率、文化禁忌词、敬语规范等指标,首次针对行业的细分领域构建评测数据和评测方法。这些指标均来自真实场景的使用反馈,测评方法也已开源
AI2.0公司零一万物正式发布模型Yi-34B,阿里云魔搭社区ModelScope首发。
达摩院副院长周靖人发布阿里巴巴最新“通义”大模型系列,宣布相关核心模型向全球开发者开源开放。