首页
快讯
观察
Toggle theme
突发,华为首个
开源
大
模型
来了
2025-07-01 09:12:33
今时不同往日,华为一改当年“绝不
开源
”的态度。
Huggingface CEO:阿里Qwen-2成为
开源
大
模型
排行榜第一
2024-06-27 09:54:19
他表示,阿里
开源
的Qwen-2 72B力压科技、社交巨头Meta的Llama-3、法国著名大
模型
平台Mistralai的Mixtral成为新的王者,中国在全球
开源
大
模型
领域处于领导地位。
腾讯推出Hunyuan-Large
开源
大
模型
2024-11-05 15:50:35
11月5日消息,腾讯宣布推出业界参数规模最大、效果最好的
开源
MoE大语言
模型
Hunyuan-Large。该
模型
的总参数量为389B,激活参数为52B,训练token数量为7T,最大上下文长度为256K。
小米突然放大招,
开源
大
模型
干趴阿里、Open AI
2025-05-06 11:55:03
好戏才刚刚开始。
阿里云周靖人:全新
开源
大
模型
Qwen-14B提供更强大的认知等能力
2023-09-25 14:49:03
9月25日消息,阿里云智能首席技术官周靖人在通义千问
开源
发布会上宣布,将全新
开源
性能更强的大
模型
Qwen-14B,该
模型
基于140亿参数,3万亿token训练的
开源
大
模型
提供更强大的推理、认知、规划和记忆能力。此外,相比之前的
开源
版本,新的QWEN-7B
模型
能力普遍提升,核心指标最高提升22.5%。
阿里巴巴将
开源
目前国内参数规模最大的大
模型
2023-11-09 10:39:26
11月9日消息,阿里巴巴集团CEO吴泳铭今日在2023年世界互联网大会乌镇峰会上透露,阿里巴巴即将
开源
720亿参数大
模型
,这将是国内参数规模最大的
开源
大
模型
。
阿里云
开源
通义千问720亿参数
模型
2023-12-01 10:36:04
12月1日消息,在通义千问发布会上,阿里云
开源
通义千问720亿参数
模型
Qwen-72B、18亿参数
模型
Qwen-1.8B及音频大
模型
Qwen-Audio。据悉,阿里云本次
开源
的
模型
中除预训练
模型
外,还同步推出了对应的对话
模型
,面向72B、1.8B对话
模型
提供了4bit/8bit量化版
模型
,便于开发者们推理训练。
腾讯混元宣布
开源
首个多模态统一CoT奖励
模型
2025-05-14 09:31:26
5月14日消息,腾讯混元近日与上海AI Lab、复旦大学、上海创智学院联合提出全新研究工作UnifiedReward-Think,构建出首个具备长链式推理能力的统一多模态奖励
模型
,首次让奖励
模型
在各视觉任务上真正“学会思考”,实现对复杂视觉生成与理解任务的准确评估、跨任务泛化与推理可解释性的大幅提升。目前,该项目已全面
开源
,包括
模型
、数据集、训练脚本与评测工具。
阿里云通义千问70亿参数
模型
开源
2023-08-03 14:50:39
8月3日消息,据36氪,阿里云今日
开源
通义千问70亿参数
模型
,包括通用
模型
Qwen-7B和对话
模型
Qwen-7B-Chat,两款
模型
均已上线魔搭社区,
开源
、免费、可商用。此举让阿里云成为国内首个加入大
模型
开源
行列的大型科技企业。
腾讯混元文生图大
模型
开源
训练代码
2024-06-21 14:17:14
今日,腾讯混元文生图大
模型
(混元DiT
模型
)宣布全面
开源
训练代码,同时对外
开源
混元DiTLoRA小规模数据集训练方案与可控制插件ControlNet。
阿里云周靖人宣布通义千问720亿参数
模型
开源
2023-12-01 11:37:59
阿里云CTO周靖人今天宣布阿里云
开源
通义千问720亿参数
模型
Qwen-72B。
阿里通义千问登顶OpenCompass
开源
基模评测榜
2023-12-12 11:46:32
12月12日消息,中国权威的大
模型
评测平台OpenCompass日前更新了榜单,阿里云通义千问72B
模型
登上
开源
基座大
模型
榜首。OpenCompass是上海人工智能实验室
开源
的大
模型
评测平台,涵盖学科、语言、知识、理解、推理等五大评测维度,可全面评估大
模型
能力。此前,通义千问还曾力压Llama2登顶全球最具权威性的HuggingFace
开源
大
模型
排行榜。
腾讯混元发布
开源
加速库 生图时间缩短75%
2024-06-06 14:07:34
6月6日消息,腾讯发布针对腾讯混元文生图
开源
大
模型
加速库,生图时间缩短75%。混元DiT
模型
的使用门槛也大幅降低。混元DiT
模型
已经部署至Hugging Face Diffusers通用
模型
库中,用户仅用三行代码即可调用混元DiT
模型
,无需下载原始代码库。
报告:阿里
模型
性能及商用能力蝉联中国第一
2025-04-16 14:32:35
4月16日消息,Omdia近日发布《2025年度中国商用大
模型
》厂商评估报告,阿里连续第二年获评领导者,商用基础
模型
竞争力整体第一,并在
模型
能力和执行能力两大核心维度蝉联榜首。截至目前,阿里已
开源
200多款通义大
模型
,通义千问在全世界的衍生
模型
数破10万,超越美国Llama成为世界第一
开源
大
模型
。
李彦宏:没有应用,基础
模型
将一文不值
2024-07-04 14:25:43
7月4日消息,在2024WAIC期间,百度创始人、董事长兼首席执行官表示,
模型
开源
与代码
开源
不同,无法做到众人拾柴火焰高。激烈竞争环境中,商业化闭源
模型
最能打。“当然这些都不是最重要的。没有应用,光有基础
模型
,不管是
开源
还是闭源,都是一文不值。”
消息称罗福莉将加入小米 或领导小米大
模型
团队
2024-12-21 16:12:59
12月21日消息,据第一财经《新皮层》消息,DeepSeek
开源
大
模型
DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米AI实验室,领导小米大
模型
团队。知情人士称,雷军认为小米在大
模型
领域发力太晚,于是亲自挖人,重金招募能够领军小米大
模型
的人才,支付的薪酬水平在千万元级别。小米AI实验室正式成立于2016年年初,目前团队大约有250人,研究方向包括视觉、声学、语音、自然语言处理、知识图谱、机器学习和大
模型
。
度小满发布“轩辕70B”金融大
模型
2023-09-22 16:55:20
9月22日消息,度小满今日宣布“轩辕70B”金融大
模型
开源
,所有用户均可自由下载和试用。据介绍,本次发布的新版大
模型
相较上一个版本能力全面提升:在增量预训练和指令微调阶段,加入了度小满业务场景中的海量金融数据,对金融问题回复更专业,金融知识理解能力提升明显;同时在预训练阶段,“轩辕70B”的
模型
上下文长度扩充到8k,能够处理更长的金融报告、研究和分析。
周鸿祎祝贺阿里AI登顶
开源
第一
2024-06-16 11:05:43
6月16日消息,图灵奖得主、Meta首席AI科学家杨立昆近日联合Abacus.AI、纽约大学等机构推出全新的大
模型
测评基准LiveBench AI,并公布首个测评榜单。阿里云通义千问刚刚
开源
的大
模型
Qwen2-72B成为排名最高的
开源
大
模型
,是前十榜单中唯一的
开源
大
模型
、唯一的中国大
模型
,成绩超过Meta的Llama3-70B
模型
。6月15日,周鸿祎发视频祝贺阿里巴巴通义千问2登上世界榜单第一名。
阿里云通义千问登顶HuggingFace排行榜
2023-12-08 17:04:34
12月8日消息,全球最大的
开源
大
模型
社区HuggingFace日前公布了最新的
开源
大
模型
排行榜,阿里云通义千问登顶榜首。据了解,HuggingFace的
开源
大
模型
排行榜收录了全球上百个
开源
大
模型
,测试维度涵盖阅读理解、逻辑推理、数学计算、事实问答等六大评测。
途牛“AI助手小牛”正式上线
2025-04-01 14:22:13
“AI助手小牛”结合旅行垂直应用场景与
开源
大
模型
(DeepSeek、通义千问),可为用户提供机票、酒店、火车票快捷查询、预订等一站式服务。
‹‹
‹
1
2
3
4
›
››