腾讯混元图像3.0登顶LMArena全球盲测第一

田宁
2025-10-05 15:16

10月5日消息,文生图领域的“权威竞技场”LMArena放榜 —— 发布仅一周的混元图像3.0,从全球26个大模型里突围,登顶第一,超过nano-banana等顶尖闭源模型。腾讯混元图像3.0不仅夺得文生图全球第一,在Hugging Face开源社区也受到了开发者的喜爱,持续一周稳居开源模型热榜第一。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:腾讯混元公众号

据介绍,LMArena是美国加州大学伯克利分校推出的创新AI模型评估平台,评测核心方法是基于人类真实偏好的“盲测”机制,让用户对不同AI模型的回答进行匿名投票,衡量模型的表现。用户输入问题后,平台提供两个模型的回答,用户根据偏好选择更优答案,投票结果直接塑造公共排行榜。由于该平台访问量巨大,并且评测机制贴近实际体验,是目前国际上最权威的竞技场榜单。

早在9月初,混元图像2.1发布开源时,就已是 “当时效果最佳开源生图模型” ;不到一个月,混元图像3.0直接再破纪录 —— 超越众多顶级闭源模型,成为目前效果最好的开源生图模型。

如今腾讯混元已搭起覆盖语言、图像、视频、3D模型的多尺寸、多模态开源矩阵,给出的开源基座能直逼商业模型。光社区图像、视频衍生模型就超过3000个,而混元3D系列 ——社区下载量超260万,成为全球最受欢迎的3D开源模型,之前还拿过全球3D生成榜单第一。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
9月28日消息,腾讯推出并开源原生多模态图像生成模型“图像3.0(HunyuanImage 3.0)”,参数规模达80B。据悉,该模型是首个开源工业级原生多模态生图模型,腾讯表示该模型效果能够对标业界头部闭模型。此外,模型能够利用知识进行推理,解析千字级别的复杂语义,并生成长文本文字。
8月13日消息,腾讯发布多模态理解模型Large-Vision。它采用MoE架构,激活参数52B,同时支持任意分辨率图像、视频、3D空间输入,重点提升了多语言场景理解能力。
1月21日消息,腾讯3D AI创作引擎今日上线,这个创作引擎可通过提示词或图片,直接生成高质量3D模型。此外,还有3D功能矩阵、3D编辑、3D生成工作流、创作素材库等多种功能。
3月6日消息,腾讯上线并开源图生视频模型,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K视频。据介绍,只需三步,用户就可以用图片生成一支5秒长的短片。目前,腾讯图生视频模型已在腾讯云上线,企业和开发者可通过官网申请调用API接口。腾讯还将其对外开源,包含权重、推理代码和LoRA训练代码,开发者可在Github、HuggingFace等主流社区下载。
9月10日消息,腾讯最新的生图模型“图像2.1(HunyuanImage 2.1)”正式发布,支持最长达1000个tokens的提示词,支持原生2K生图。此外,腾讯方面透露,“原生多模态图像生成模型,也在路上了。”本次,还开源中英文改写模型——文本改写模型(PromptEnhancer),能够对用户的文本指令进行结构化优化。
10月26日消息,腾讯宣布,腾讯大模型迎来全新升级,并正式对外开放“文生图”功能,展示了其在图像自动生成领域的领先能力。升级后的腾讯中文效果整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。
5月28日消息,腾讯发布并开源的语音数字人模型HunyuanVideo-Avatar,由腾讯视频大模型(HunyuanVideo)及腾讯音乐天琴实验室MuseV技术联合研发,支持头肩、半身与全身景别,以及多风格、多物种与双人场景,面向视频创作者提供高一致性、高动态性的视频生成能力。用户可上传人物图像与音频,HunyuanVideo-Avatar模型会自动理解图片与音频,比如人物所在环境、音频所蕴含的情感等,让图中人物自然地说话或唱歌,生成包含自然表情、唇形同步及全身动作的视频。
2月26日消息,天眼查知识产权信息显示,近日,腾讯科技有限公司申请注册多枚“腾讯生图”商标,国际分类包括科学仪器、广告销售、教育娱乐等,当前商标状态均为等待实质审查。据媒体报道,此前,腾讯大模型正式对外开放“文生图”功能。该功能可实现输入对图片的描述文字后,AI平台根据文字描述生成对应的图片