首页
快讯
观察
Toggle theme
阿里云CTO周靖人:通义千问和ChatGPT互有胜负
2023-12-04 16:21:22
12月4日消息,阿里云近日
开源
了通义千问720亿参数
模型
Qwen-72B,这也是目前国内大
模型
开源
的最大参数,至此,通义千问共
开源
了18亿、70亿、140亿、720亿参数的4款大
模型
。阿里云CTO周靖人在通义千问发布会后做了一场闭门分享,他提到:“我们能看到之间有一定差距,还有需要提升的空间,但是不能妄自菲薄。比如多模态等,国内很多产品也能做到ChatGPT的水平,甚至超越它。通义千问和ChatGPT 4.0在使用体感上,是互有胜负的。”
宝宝树完成与DeepSeek深度融合
2025-02-10 18:01:23
2月10日消息,宝宝树集团宣布已完成与
开源
大
模型
DeepSeek-R1的全面接入工作。据介绍,宝宝树创新工作室通过知识蒸馏技术,将DeepSeek-R1的强大推理能力迁移到更轻量级的Mika-Brain母婴垂域
模型
中,显著降低了资源消耗与使用成本。同时,通过多智能体引导机制优化R1输出,确保生成的回答更贴合母婴用户的需求,并设计了专门的奖励
模型
,以持续优化性能。
猎芯网接入DeepSeek 上线“芯宝”AI精灵
2025-03-10 10:47:06
3月10日消息,猎芯网近日宣布全面接入国产
开源
大
模型
DeepSeek R1,“芯宝”AI精灵已上线,通过深度融合AI技术,猎芯网将重塑电子元器件采购流程,为工程师、采购商和终端工厂提供从选型、替代到方案设计的高效支持。
阿里云入选“2024中国互联网企业创新发展典型案例”
2024-11-21 16:18:33
11月21日消息,在世界互联网大会乌镇峰会上,阿里云“全模态全尺寸的通义
开源
大
模型
”被评为2024中国互联网企业创新发展典型案例,成为唯一入选的
开源
大
模型
成果案例。据悉,通义Qwen是全球领先的大
模型
,多次登顶国内外权威大
模型
榜单,全球范围内基于Qwen的衍生
模型
数逾7.8万个,Qwen已成为全球规模最大的生成式
模型
群。
途牛“AI助手小牛”正式上线
2025-04-01 14:13:37
4月1日消息,途牛旅游网自主研发的“AI助手小牛”旅游应用Agent正式上线途牛旅游APP、“AI助手小牛”小程序。“AI助手小牛”结合旅行垂直应用场景与
开源
大
模型
(DeepSeek、通义千问),实现了机票、酒店、火车票快捷查询、预订服务,能够为用户提供智能、专业的“0搭售"旅游服务方案。
豆包大
模型
团队
开源
视频生成
模型
VideoWorld
2025-02-10 14:38:39
2月10日消息,豆包大
模型
团队联合北京交通大学、中国科学技术大学共同开发的视频生成实验
模型
“VideoWorld”正式
开源
。不同于Sora 、DALL-E 、Midjourney等主流多模态
模型
,VideoWorld在业界首次实现无需依赖语言
模型
,即可认知世界。
豆包大
模型
团队
开源
基准测试集SuperGPQA
2025-03-04 11:53:10
3月4日消息,豆包大
模型
团队近日
开源
SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。该数据集构建了覆盖285个研究生级学科、包含26529道专业问题的评估体系,不仅涵盖主流学科,更将轻工业、农业、服务科学等长尾学科纳入其中,展现出全面学科的覆盖广度,填补了长尾知识评估领域的空白。
阿里达摩院
开源
深度语言
模型
体系AliceMind
2021-06-23 10:28:43
6月23日消息,日前,阿里巴巴达摩院正式
开源
深度语言
模型
体系AliceMind。据悉,历经三年研发,AliceMind从通用语言
模型
StructBERT的基础上,拓展到多语言、生成式、多模态、结构化、知识驱动等领域。目前,AliceMind掌握语言超过100种,具有阅读、写作、翻译、问答、搜索、摘要生成、对话等多种能力,现已成为阿里的语言技术底座,日均调用量超过50亿次,活跃场景超过200个。
阿里通义
开源
音频语言
模型
Qwen2-Audio
2024-08-13 11:17:32
8月13日消息,阿里通义大
模型
继续
开源
,Qwen2系列
开源
家族新增音频语言
模型
Qwen2-Audio。Qwen2-Audio可以不需文本输入,直接进行语音问答,理解并分析用户输入的音频信号,包括人声、自然音、音乐等。该
模型
在多个权威测评中都显著超越先前的最佳
模型
。通义团队还同步推出了一套全新的音频理解
模型
测评基准,相关论文已入选本周正在举办的国际顶会ACL 2024。
阿里云通义
开源
推理大
模型
QwQ
2024-11-28 17:28:06
11月28日消息,阿里云通义团队发布全新AI推理模型QwQ-32B-Preview,并同步
开源
。评测数据显示,预览版本的QwQ,已展现出研究生水平的科学推理能力,在数学和编程方面表现尤为出色,整体推理水平比肩OpenAI o1。
小红书首次
开源
文本大
模型
2025-06-09 10:12:12
小红书近日
开源
了首个大
模型
——dots.llm1。
小红书首次
开源
文本大
模型
2025-06-09 10:13:33
6月9日消息,小红书近日
开源
了首个大
模型
——dots.llm1。dots.llm1是一个中等规模的Mixture of Experts(MoE)文本大
模型
,由小红书 hi lab(Humane Intelligence Lab,人文智能实验室)团队研发,总参数量142B,激活参数14B。
小红书
开源
首个大
模型
,中文性能碾压DeepSeek
2025-06-30 10:48:58
在无人问津的角落,小红书悄悄震惊世界。
阿里通义千问与DeepSeek
开源
两款新
模型
2025-03-26 11:16:10
3月26日消息,阿里通义千问与DeepSeek均于昨日低调
开源
了两款新
模型
。阿里发布了更适合本地部署的高性能“多模态
模型
”Qwen2.5-VL-32B,DeepSeek则将此前热门的“基座
模型
”V3更新到0324版本,并官宣在魔搭社区上架
开源
。截至目前,魔搭社区
模型
总数已超4万个,已成为中国最大的AI
开源
社区。
京东健康旗下“京医千询”医疗大
模型
全面
开源
2025-03-02 11:25:04
京东健康旗下“京医千询”医疗大
模型
近日启动
开源
,成为国内医疗行业首个全面
开源
的垂类大
模型
。
京东健康旗下“京医千询”医疗大
模型
全面
开源
2025-03-02 11:26:49
3月2日消息,京东健康旗下“京医千询”医疗大
模型
近日启动
开源
,成为国内医疗行业首个全面
开源
的垂类大
模型
。此次启动全面
开源
,意味着“京医千询”医疗大
模型
的所有
模型
参数、数据构造、多阶段
模型
训练、
模型
评测等核心代码都将公开,显示出京东健康在推动医疗AI技术进步、和以医疗AI驱动医疗行业转型发展方面的决心。
阿里云通义
开源
首个推理步骤评估标准
2025-01-16 14:38:21
1月16日消息,阿里云通义
开源
全新的数学推理过程奖励
模型
Qwen2.5-Math-PRM,72B及7B尺寸
模型
性能均大幅超越同类
开源
过程奖励
模型
;在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时,通义团队还
开源
首个步骤级的评估标准 ProcessBench,填补了大
模型
推理过程错误评估的空白。
阿里天猫精灵推出AI治理
开源
数据集
2023-06-04 09:55:13
6月4日消息,阿里巴巴旗下的天猫精灵与通义大
模型
团队联合多位领域学者和组织,推出了一个名为100PoisonMpts的大语言
模型
治理
开源
中文数据集,宣布十余位知名专家学者成为首批“给AI投100瓶毒药”的标注工程师。标注人各提出100个含有偏见和歧视回答的棘手问题,并标注出大型
模型
的回答,完成由AI"投毒"和"解毒"的攻防。100PoisonMpts数据集预计在6月开放第一批问答数据,目前正在魔搭等技术社区征集更多垂直领域专家。
度小满”轩辕”系列发布12款金融大
模型
2024-03-11 12:00:14
3月11日消息,度小满宣布“轩辕”系列金融大
模型
新增
开源
6B、13B、70B三种参数12款金融大
模型
。这12款大
模型
具有“以小搏大”的实力,在用户信息分析、业务数据洞察等十余种金融实际任务评测中,达到自身2倍甚至5倍参数量的
模型
水平。目前,”轩辕”金融大
模型
已经应用在度小满各个业务场景,从营销、客服、风控、办公再到研发,已经初见成效。
度小满CTO许冬亮:金融大
模型
将助力中小银行跨越“智能化鸿沟”
2023-05-30 17:00:57
5月30日消息,以“数字化转型与金融安全”为主题的2023中关村论坛金融科技平行论坛日前在京召开。许冬亮在论坛上表示,从增量市场过渡到成熟市场时,金融行业呈现出竞争加剧,客户留存难,产品同质化竞争加剧等趋势。中小银行不仅面临“数字鸿沟”,也在面临智能化挑战。许冬亮表示,度小满把大
模型
能力
开源
,希望能够降低大
模型
的应用门槛,助力中小银行跨越“数字鸿沟”和“智能化鸿沟”。
‹‹
‹
1
2
3
4
5
›
››