首页
快讯
观察
Toggle theme
阿里巴巴将
开源
目前国内参数规模最大的大
模型
2023-11-09 10:39:26
11月9日消息,阿里巴巴集团CEO吴泳铭今日在2023年世界互联网大会乌镇峰会上透露,阿里巴巴即将
开源
720亿参数大
模型
,这将是国内参数规模最大的
开源
大
模型
。
阿里云
开源
通义千问720亿参数
模型
2023-12-01 10:36:04
12月1日消息,在通义千问发布会上,阿里云
开源
通义千问720亿参数
模型
Qwen-72B、18亿参数
模型
Qwen-1.8B及音频大
模型
Qwen-Audio。据悉,阿里云本次
开源
的
模型
中除预训练
模型
外,还同步推出了对应的对话
模型
,面向72B、1.8B对话
模型
提供了4bit/8bit量化版
模型
,便于开发者们推理训练。
腾讯混元宣布
开源
首个多模态统一CoT奖励
模型
2025-05-14 09:31:26
5月14日消息,腾讯混元近日与上海AI Lab、复旦大学、上海创智学院联合提出全新研究工作UnifiedReward-Think,构建出首个具备长链式推理能力的统一多模态奖励
模型
,首次让奖励
模型
在各视觉任务上真正“学会思考”,实现对复杂视觉生成与理解任务的准确评估、跨任务泛化与推理可解释性的大幅提升。目前,该项目已全面
开源
,包括
模型
、数据集、训练脚本与评测工具。
阿里云通义千问70亿参数
模型
开源
2023-08-03 14:50:39
8月3日消息,据36氪,阿里云今日
开源
通义千问70亿参数
模型
,包括通用
模型
Qwen-7B和对话
模型
Qwen-7B-Chat,两款
模型
均已上线魔搭社区,
开源
、免费、可商用。此举让阿里云成为国内首个加入大
模型
开源
行列的大型科技企业。
腾讯混元文生图大
模型
开源
训练代码
2024-06-21 14:17:14
今日,腾讯混元文生图大
模型
(混元DiT
模型
)宣布全面
开源
训练代码,同时对外
开源
混元DiTLoRA小规模数据集训练方案与可控制插件ControlNet。
阿里云周靖人宣布通义千问720亿参数
模型
开源
2023-12-01 11:37:59
阿里云CTO周靖人今天宣布阿里云
开源
通义千问720亿参数
模型
Qwen-72B。
阿里通义千问登顶OpenCompass
开源
基模评测榜
2023-12-12 11:46:32
12月12日消息,中国权威的大
模型
评测平台OpenCompass日前更新了榜单,阿里云通义千问72B
模型
登上
开源
基座大
模型
榜首。OpenCompass是上海人工智能实验室
开源
的大
模型
评测平台,涵盖学科、语言、知识、理解、推理等五大评测维度,可全面评估大
模型
能力。此前,通义千问还曾力压Llama2登顶全球最具权威性的HuggingFace
开源
大
模型
排行榜。
腾讯混元发布
开源
加速库 生图时间缩短75%
2024-06-06 14:07:34
6月6日消息,腾讯发布针对腾讯混元文生图
开源
大
模型
加速库,生图时间缩短75%。混元DiT
模型
的使用门槛也大幅降低。混元DiT
模型
已经部署至Hugging Face Diffusers通用
模型
库中,用户仅用三行代码即可调用混元DiT
模型
,无需下载原始代码库。
报告:阿里
模型
性能及商用能力蝉联中国第一
2025-04-16 14:32:35
4月16日消息,Omdia近日发布《2025年度中国商用大
模型
》厂商评估报告,阿里连续第二年获评领导者,商用基础
模型
竞争力整体第一,并在
模型
能力和执行能力两大核心维度蝉联榜首。截至目前,阿里已
开源
200多款通义大
模型
,通义千问在全世界的衍生
模型
数破10万,超越美国Llama成为世界第一
开源
大
模型
。
李彦宏:没有应用,基础
模型
将一文不值
2024-07-04 14:25:43
7月4日消息,在2024WAIC期间,百度创始人、董事长兼首席执行官表示,
模型
开源
与代码
开源
不同,无法做到众人拾柴火焰高。激烈竞争环境中,商业化闭源
模型
最能打。“当然这些都不是最重要的。没有应用,光有基础
模型
,不管是
开源
还是闭源,都是一文不值。”
消息称罗福莉将加入小米 或领导小米大
模型
团队
2024-12-21 16:12:59
12月21日消息,据第一财经《新皮层》消息,DeepSeek
开源
大
模型
DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米AI实验室,领导小米大
模型
团队。知情人士称,雷军认为小米在大
模型
领域发力太晚,于是亲自挖人,重金招募能够领军小米大
模型
的人才,支付的薪酬水平在千万元级别。小米AI实验室正式成立于2016年年初,目前团队大约有250人,研究方向包括视觉、声学、语音、自然语言处理、知识图谱、机器学习和大
模型
。
度小满发布“轩辕70B”金融大
模型
2023-09-22 16:55:20
9月22日消息,度小满今日宣布“轩辕70B”金融大
模型
开源
,所有用户均可自由下载和试用。据介绍,本次发布的新版大
模型
相较上一个版本能力全面提升:在增量预训练和指令微调阶段,加入了度小满业务场景中的海量金融数据,对金融问题回复更专业,金融知识理解能力提升明显;同时在预训练阶段,“轩辕70B”的
模型
上下文长度扩充到8k,能够处理更长的金融报告、研究和分析。
周鸿祎祝贺阿里AI登顶
开源
第一
2024-06-16 11:05:43
6月16日消息,图灵奖得主、Meta首席AI科学家杨立昆近日联合Abacus.AI、纽约大学等机构推出全新的大
模型
测评基准LiveBench AI,并公布首个测评榜单。阿里云通义千问刚刚
开源
的大
模型
Qwen2-72B成为排名最高的
开源
大
模型
,是前十榜单中唯一的
开源
大
模型
、唯一的中国大
模型
,成绩超过Meta的Llama3-70B
模型
。6月15日,周鸿祎发视频祝贺阿里巴巴通义千问2登上世界榜单第一名。
阿里云通义千问登顶HuggingFace排行榜
2023-12-08 17:04:34
12月8日消息,全球最大的
开源
大
模型
社区HuggingFace日前公布了最新的
开源
大
模型
排行榜,阿里云通义千问登顶榜首。据了解,HuggingFace的
开源
大
模型
排行榜收录了全球上百个
开源
大
模型
,测试维度涵盖阅读理解、逻辑推理、数学计算、事实问答等六大评测。
途牛“AI助手小牛”正式上线
2025-04-01 14:22:13
“AI助手小牛”结合旅行垂直应用场景与
开源
大
模型
(DeepSeek、通义千问),可为用户提供机票、酒店、火车票快捷查询、预订等一站式服务。
阿里云CTO周靖人:通义千问和ChatGPT互有胜负
2023-12-04 16:21:22
12月4日消息,阿里云近日
开源
了通义千问720亿参数
模型
Qwen-72B,这也是目前国内大
模型
开源
的最大参数,至此,通义千问共
开源
了18亿、70亿、140亿、720亿参数的4款大
模型
。阿里云CTO周靖人在通义千问发布会后做了一场闭门分享,他提到:“我们能看到之间有一定差距,还有需要提升的空间,但是不能妄自菲薄。比如多模态等,国内很多产品也能做到ChatGPT的水平,甚至超越它。通义千问和ChatGPT 4.0在使用体感上,是互有胜负的。”
宝宝树完成与DeepSeek深度融合
2025-02-10 18:01:23
2月10日消息,宝宝树集团宣布已完成与
开源
大
模型
DeepSeek-R1的全面接入工作。据介绍,宝宝树创新工作室通过知识蒸馏技术,将DeepSeek-R1的强大推理能力迁移到更轻量级的Mika-Brain母婴垂域
模型
中,显著降低了资源消耗与使用成本。同时,通过多智能体引导机制优化R1输出,确保生成的回答更贴合母婴用户的需求,并设计了专门的奖励
模型
,以持续优化性能。
猎芯网接入DeepSeek 上线“芯宝”AI精灵
2025-03-10 10:47:06
3月10日消息,猎芯网近日宣布全面接入国产
开源
大
模型
DeepSeek R1,“芯宝”AI精灵已上线,通过深度融合AI技术,猎芯网将重塑电子元器件采购流程,为工程师、采购商和终端工厂提供从选型、替代到方案设计的高效支持。
阿里云入选“2024中国互联网企业创新发展典型案例”
2024-11-21 16:18:33
11月21日消息,在世界互联网大会乌镇峰会上,阿里云“全模态全尺寸的通义
开源
大
模型
”被评为2024中国互联网企业创新发展典型案例,成为唯一入选的
开源
大
模型
成果案例。据悉,通义Qwen是全球领先的大
模型
,多次登顶国内外权威大
模型
榜单,全球范围内基于Qwen的衍生
模型
数逾7.8万个,Qwen已成为全球规模最大的生成式
模型
群。
途牛“AI助手小牛”正式上线
2025-04-01 14:13:37
4月1日消息,途牛旅游网自主研发的“AI助手小牛”旅游应用Agent正式上线途牛旅游APP、“AI助手小牛”小程序。“AI助手小牛”结合旅行垂直应用场景与
开源
大
模型
(DeepSeek、通义千问),实现了机票、酒店、火车票快捷查询、预订服务,能够为用户提供智能、专业的“0搭售"旅游服务方案。
‹‹
‹
1
2
3
4
›
››