搜索

阿里云CTO周靖人：通义千问和ChatGPT互有胜负
2023-12-04 16:21:22
12月4日消息，阿里云近日开源了通义千问720亿参数模型Qwen-72B，这也是目前国内大模型开源的最大参数，至此，通义千问共开源了18亿、70亿、140亿、720亿参数的4款大模型。阿里云CTO周靖人在通义千问发布会后做了一场闭门分享，他提到：“我们能看到之间有一定差距，还有需要提升的空间，但是不能妄自菲薄。比如多模态等，国内很多产品也能做到ChatGPT的水平，甚至超越它。通义千问和ChatGPT 4.0在使用体感上，是互有胜负的。”
宝宝树完成与DeepSeek深度融合
2025-02-10 18:01:23
2月10日消息，宝宝树集团宣布已完成与开源大模型DeepSeek-R1的全面接入工作。据介绍，宝宝树创新工作室通过知识蒸馏技术，将DeepSeek-R1的强大推理能力迁移到更轻量级的Mika-Brain母婴垂域模型中，显著降低了资源消耗与使用成本。同时，通过多智能体引导机制优化R1输出，确保生成的回答更贴合母婴用户的需求，并设计了专门的奖励模型，以持续优化性能。
猎芯网接入DeepSeek 上线“芯宝”AI精灵
2025-03-10 10:47:06
3月10日消息，猎芯网近日宣布全面接入国产开源大模型DeepSeek R1，“芯宝”AI精灵已上线，通过深度融合AI技术，猎芯网将重塑电子元器件采购流程，为工程师、采购商和终端工厂提供从选型、替代到方案设计的高效支持。
阿里云入选“2024中国互联网企业创新发展典型案例”
2024-11-21 16:18:33
11月21日消息，在世界互联网大会乌镇峰会上，阿里云“全模态全尺寸的通义开源大模型”被评为2024中国互联网企业创新发展典型案例，成为唯一入选的开源大模型成果案例。据悉，通义Qwen是全球领先的大模型，多次登顶国内外权威大模型榜单，全球范围内基于Qwen的衍生模型数逾7.8万个，Qwen已成为全球规模最大的生成式模型群。
途牛“AI助手小牛”正式上线
2025-04-01 14:13:37
4月1日消息，途牛旅游网自主研发的“AI助手小牛”旅游应用Agent正式上线途牛旅游APP、“AI助手小牛”小程序。“AI助手小牛”结合旅行垂直应用场景与开源大模型（DeepSeek、通义千问），实现了机票、酒店、火车票快捷查询、预订服务，能够为用户提供智能、专业的“0搭售"旅游服务方案。
豆包大模型团队开源视频生成模型VideoWorld
2025-02-10 14:38:39
2月10日消息，豆包大模型团队联合北京交通大学、中国科学技术大学共同开发的视频生成实验模型“VideoWorld”正式开源。不同于Sora 、DALL-E 、Midjourney等主流多模态模型，VideoWorld在业界首次实现无需依赖语言模型，即可认知世界。
豆包大模型团队开源基准测试集SuperGPQA
2025-03-04 11:53:10
3月4日消息，豆包大模型团队近日开源SuperGPQA，一个领域全面且具备高区分度的知识推理基准测试。该数据集构建了覆盖285个研究生级学科、包含26529道专业问题的评估体系，不仅涵盖主流学科，更将轻工业、农业、服务科学等长尾学科纳入其中，展现出全面学科的覆盖广度，填补了长尾知识评估领域的空白。
阿里达摩院开源深度语言模型体系AliceMind
2021-06-23 10:28:43
6月23日消息，日前，阿里巴巴达摩院正式开源深度语言模型体系AliceMind。据悉，历经三年研发，AliceMind从通用语言模型StructBERT的基础上，拓展到多语言、生成式、多模态、结构化、知识驱动等领域。目前，AliceMind掌握语言超过100种，具有阅读、写作、翻译、问答、搜索、摘要生成、对话等多种能力，现已成为阿里的语言技术底座，日均调用量超过50亿次，活跃场景超过200个。
阿里通义开源音频语言模型Qwen2-Audio
2024-08-13 11:17:32
8月13日消息，阿里通义大模型继续开源，Qwen2系列开源家族新增音频语言模型Qwen2-Audio。Qwen2-Audio可以不需文本输入，直接进行语音问答，理解并分析用户输入的音频信号，包括人声、自然音、音乐等。该模型在多个权威测评中都显著超越先前的最佳模型。通义团队还同步推出了一套全新的音频理解模型测评基准，相关论文已入选本周正在举办的国际顶会ACL 2024。
阿里云通义开源推理大模型QwQ
2024-11-28 17:28:06
11月28日消息，阿里云通义团队发布全新AI推理模型QwQ-32B-Preview，并同步开源。评测数据显示，预览版本的QwQ，已展现出研究生水平的科学推理能力，在数学和编程方面表现尤为出色，整体推理水平比肩OpenAI o1。
小红书首次开源文本大模型
2025-06-09 10:12:12
小红书近日开源了首个大模型——dots.llm1。
小红书首次开源文本大模型
2025-06-09 10:13:33
6月9日消息，小红书近日开源了首个大模型——dots.llm1。dots.llm1是一个中等规模的Mixture of Experts（MoE）文本大模型，由小红书 hi lab（Humane Intelligence Lab，人文智能实验室）团队研发，总参数量142B，激活参数14B。
小红书开源首个大模型，中文性能碾压DeepSeek
2025-06-30 10:48:58
在无人问津的角落，小红书悄悄震惊世界。
阿里通义千问与DeepSeek开源两款新模型
2025-03-26 11:16:10
3月26日消息，阿里通义千问与DeepSeek均于昨日低调开源了两款新模型。阿里发布了更适合本地部署的高性能“多模态模型”Qwen2.5-VL-32B，DeepSeek则将此前热门的“基座模型”V3更新到0324版本，并官宣在魔搭社区上架开源。截至目前，魔搭社区模型总数已超4万个，已成为中国最大的AI开源社区。
京东健康旗下“京医千询”医疗大模型全面开源
2025-03-02 11:25:04
京东健康旗下“京医千询”医疗大模型近日启动开源，成为国内医疗行业首个全面开源的垂类大模型。
京东健康旗下“京医千询”医疗大模型全面开源
2025-03-02 11:26:49
3月2日消息，京东健康旗下“京医千询”医疗大模型近日启动开源，成为国内医疗行业首个全面开源的垂类大模型。此次启动全面开源，意味着“京医千询”医疗大模型的所有模型参数、数据构造、多阶段模型训练、模型评测等核心代码都将公开，显示出京东健康在推动医疗AI技术进步、和以医疗AI驱动医疗行业转型发展方面的决心。
阿里云通义开源首个推理步骤评估标准
2025-01-16 14:38:21
1月16日消息，阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型；在识别推理错误步骤能力上，Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时，通义团队还开源首个步骤级的评估标准 ProcessBench，填补了大模型推理过程错误评估的空白。
阿里天猫精灵推出AI治理开源数据集
2023-06-04 09:55:13
6月4日消息，阿里巴巴旗下的天猫精灵与通义大模型团队联合多位领域学者和组织，推出了一个名为100PoisonMpts的大语言模型治理开源中文数据集，宣布十余位知名专家学者成为首批“给AI投100瓶毒药”的标注工程师。标注人各提出100个含有偏见和歧视回答的棘手问题，并标注出大型模型的回答，完成由AI"投毒"和"解毒"的攻防。100PoisonMpts数据集预计在6月开放第一批问答数据，目前正在魔搭等技术社区征集更多垂直领域专家。
度小满”轩辕”系列发布12款金融大模型
2024-03-11 12:00:14
3月11日消息，度小满宣布“轩辕”系列金融大模型新增开源6B、13B、70B三种参数12款金融大模型。这12款大模型具有“以小搏大”的实力，在用户信息分析、业务数据洞察等十余种金融实际任务评测中，达到自身2倍甚至5倍参数量的模型水平。目前，”轩辕”金融大模型已经应用在度小满各个业务场景，从营销、客服、风控、办公再到研发，已经初见成效。
度小满CTO许冬亮：金融大模型将助力中小银行跨越“智能化鸿沟”
2023-05-30 17:00:57
5月30日消息，以“数字化转型与金融安全”为主题的2023中关村论坛金融科技平行论坛日前在京召开。许冬亮在论坛上表示，从增量市场过渡到成熟市场时，金融行业呈现出竞争加剧，客户留存难，产品同质化竞争加剧等趋势。中小银行不仅面临“数字鸿沟”，也在面临智能化挑战。许冬亮表示，度小满把大模型能力开源，希望能够降低大模型的应用门槛，助力中小银行跨越“数字鸿沟”和“智能化鸿沟”。