搜索

突发，华为首个开源大模型来了
2025-07-01 09:12:33
今时不同往日，华为一改当年“绝不开源”的态度。
Huggingface CEO：阿里Qwen-2成为开源大模型排行榜第一
2024-06-27 09:54:19
他表示，阿里开源的Qwen-2 72B力压科技、社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral成为新的王者，中国在全球开源大模型领域处于领导地位。
腾讯推出Hunyuan-Large开源大模型
2024-11-05 15:50:35
11月5日消息，腾讯宣布推出业界参数规模最大、效果最好的开源MoE大语言模型Hunyuan-Large。该模型的总参数量为389B，激活参数为52B，训练token数量为7T，最大上下文长度为256K。
小米突然放大招，开源大模型干趴阿里、Open AI
2025-05-06 11:55:03
好戏才刚刚开始。
阿里云周靖人：全新开源大模型Qwen-14B提供更强大的认知等能力
2023-09-25 14:49:03
9月25日消息，阿里云智能首席技术官周靖人在通义千问开源发布会上宣布，将全新开源性能更强的大模型Qwen-14B，该模型基于140亿参数，3万亿token训练的开源大模型提供更强大的推理、认知、规划和记忆能力。此外，相比之前的开源版本，新的QWEN-7B模型能力普遍提升，核心指标最高提升22.5%。
阿里巴巴将开源目前国内参数规模最大的大模型
2023-11-09 10:39:26
11月9日消息，阿里巴巴集团CEO吴泳铭今日在2023年世界互联网大会乌镇峰会上透露，阿里巴巴即将开源720亿参数大模型，这将是国内参数规模最大的开源大模型。
阿里云开源通义千问720亿参数模型
2023-12-01 10:36:04
12月1日消息，在通义千问发布会上，阿里云开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B及音频大模型Qwen-Audio。据悉，阿里云本次开源的模型中除预训练模型外，还同步推出了对应的对话模型，面向72B、1.8B对话模型提供了4bit/8bit量化版模型，便于开发者们推理训练。
腾讯混元宣布开源首个多模态统一CoT奖励模型
2025-05-14 09:31:26
5月14日消息，腾讯混元近日与上海AI Lab、复旦大学、上海创智学院联合提出全新研究工作UnifiedReward-Think，构建出首个具备长链式推理能力的统一多模态奖励模型，首次让奖励模型在各视觉任务上真正“学会思考”，实现对复杂视觉生成与理解任务的准确评估、跨任务泛化与推理可解释性的大幅提升。目前，该项目已全面开源，包括模型、数据集、训练脚本与评测工具。
阿里云通义千问70亿参数模型开源
2023-08-03 14:50:39
8月3日消息，据36氪，阿里云今日开源通义千问70亿参数模型，包括通用模型Qwen-7B和对话模型Qwen-7B-Chat，两款模型均已上线魔搭社区，开源、免费、可商用。此举让阿里云成为国内首个加入大模型开源行列的大型科技企业。
腾讯混元文生图大模型开源训练代码
2024-06-21 14:17:14
今日，腾讯混元文生图大模型（混元DiT模型）宣布全面开源训练代码，同时对外开源混元DiTLoRA小规模数据集训练方案与可控制插件ControlNet。
阿里云周靖人宣布通义千问720亿参数模型开源
2023-12-01 11:37:59
阿里云CTO周靖人今天宣布阿里云开源通义千问720亿参数模型Qwen-72B。
阿里通义千问登顶OpenCompass开源基模评测榜
2023-12-12 11:46:32
12月12日消息，中国权威的大模型评测平台OpenCompass日前更新了榜单，阿里云通义千问72B模型登上开源基座大模型榜首。OpenCompass是上海人工智能实验室开源的大模型评测平台，涵盖学科、语言、知识、理解、推理等五大评测维度，可全面评估大模型能力。此前，通义千问还曾力压Llama2登顶全球最具权威性的HuggingFace开源大模型排行榜。
腾讯混元发布开源加速库生图时间缩短75%
2024-06-06 14:07:34
6月6日消息，腾讯发布针对腾讯混元文生图开源大模型加速库，生图时间缩短75%。混元DiT模型的使用门槛也大幅降低。混元DiT模型已经部署至Hugging Face Diffusers通用模型库中，用户仅用三行代码即可调用混元DiT模型，无需下载原始代码库。
报告：阿里模型性能及商用能力蝉联中国第一
2025-04-16 14:32:35
4月16日消息，Omdia近日发布《2025年度中国商用大模型》厂商评估报告，阿里连续第二年获评领导者，商用基础模型竞争力整体第一，并在模型能力和执行能力两大核心维度蝉联榜首。截至目前，阿里已开源200多款通义大模型，通义千问在全世界的衍生模型数破10万，超越美国Llama成为世界第一开源大模型。
李彦宏：没有应用，基础模型将一文不值
2024-07-04 14:25:43
7月4日消息，在2024WAIC期间，百度创始人、董事长兼首席执行官表示，模型开源与代码开源不同，无法做到众人拾柴火焰高。激烈竞争环境中，商业化闭源模型最能打。“当然这些都不是最重要的。没有应用，光有基础模型，不管是开源还是闭源，都是一文不值。”
消息称罗福莉将加入小米或领导小米大模型团队
2024-12-21 16:12:59
12月21日消息，据第一财经《新皮层》消息，DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米，或供职于小米AI实验室，领导小米大模型团队。知情人士称，雷军认为小米在大模型领域发力太晚，于是亲自挖人，重金招募能够领军小米大模型的人才，支付的薪酬水平在千万元级别。小米AI实验室正式成立于2016年年初，目前团队大约有250人，研究方向包括视觉、声学、语音、自然语言处理、知识图谱、机器学习和大模型。
度小满发布“轩辕70B”金融大模型
2023-09-22 16:55:20
9月22日消息，度小满今日宣布“轩辕70B”金融大模型开源，所有用户均可自由下载和试用。据介绍，本次发布的新版大模型相较上一个版本能力全面提升：在增量预训练和指令微调阶段，加入了度小满业务场景中的海量金融数据，对金融问题回复更专业，金融知识理解能力提升明显；同时在预训练阶段，“轩辕70B”的模型上下文长度扩充到8k，能够处理更长的金融报告、研究和分析。
周鸿祎祝贺阿里AI登顶开源第一
2024-06-16 11:05:43
6月16日消息，图灵奖得主、Meta首席AI科学家杨立昆近日联合Abacus.AI、纽约大学等机构推出全新的大模型测评基准LiveBench AI，并公布首个测评榜单。阿里云通义千问刚刚开源的大模型Qwen2-72B成为排名最高的开源大模型，是前十榜单中唯一的开源大模型、唯一的中国大模型，成绩超过Meta的Llama3-70B模型。6月15日，周鸿祎发视频祝贺阿里巴巴通义千问2登上世界榜单第一名。
阿里云通义千问登顶HuggingFace排行榜
2023-12-08 17:04:34
12月8日消息，全球最大的开源大模型社区HuggingFace日前公布了最新的开源大模型排行榜，阿里云通义千问登顶榜首。据了解，HuggingFace的开源大模型排行榜收录了全球上百个开源大模型，测试维度涵盖阅读理解、逻辑推理、数学计算、事实问答等六大评测。
途牛“AI助手小牛”正式上线
2025-04-01 14:22:13
“AI助手小牛”结合旅行垂直应用场景与开源大模型（DeepSeek、通义千问），可为用户提供机票、酒店、火车票快捷查询、预订等一站式服务。