混元图像3.0图生图模型上线元宝

田宁
2026-01-26 14:40

1月26日消息,腾讯混元发布混元图像3.0图生图(HunyuanImage 3.0-Instruct)模型,支持图片编辑与多图融合,并在“元宝”同步上线,用户可直接在元宝全端和在腾讯混元官网体验。

混元图像3.0图生图总参数量80B(激活参数约13B),采用混合专家(MoE)架构,基于混元图像3.0的原生多模态架构基础模型,引入图生图的多任务数据,通过指令微调和后训练,实现了对用户输入图像和编辑指令的深度理解与处理。混元图像3.0图生图指令遵循效果稳定,生成的图片一致性高、真实感强、情绪表现力佳,生成速度明显提升。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:腾讯混元公众号

混元图像3.0图生图是一款能理解输入图像、会思考的图像编辑模型。模型在收到用户输入的图片和提示词后,首先会先理解图像内容本身,并基于用户的提示词进行推理,推理出具体的需要进行编辑的区域、详细的编辑步骤以及需要保留的图像区域,形成更加详细的编辑指令,实现良好的输出效果。

混元图像3.0图生图支持多样化的图片编辑与多图融合能力,比如增、删、改、风格变换、老照片修复、人物与文字修改等图片编辑能力,以及把多张照片中的人物或元素提取出来合成合照与生成新图片等。在元宝上,基于该模型用户可以直接制作表情包、虚拟人物合拍、社交分享、电商海报设计、游戏角色定制、创意图片制作等。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:腾讯混元公众号

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
3月6日消息,腾讯上线并开源视频模型,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K视频。据介绍,只需三步,用户就可以用片生成一支5秒长的短片。目前,腾讯视频模型已在腾讯云上线,企业和开发者可通过官网申请调用API接口。腾讯还将其对外开源,包含权重、推理代码和LoRA训练代码,开发者可在Github、HuggingFace等主流社区下载。
2月26日消息,天眼查知识产权信息显示,近日,腾讯科技有限公司申请注册多枚“腾讯”商标,国际分类包括科学仪器、广告销售、教育娱乐等,当前商标状态均为等待实质审查。据媒体报道,此前,腾讯大模型正式对外开放“文”功能。该功能可实现输入对片的描述文字后,AI平台根据文字描述生成对应的片。
6月6日消息,腾讯发布针对腾讯开源大模型加速库,时间缩短75%。DiT模型的使用门槛也大幅降低。DiT模型已经部署至Hugging Face Diffusers通用模型库中,用户仅用三行代码即可调用DiT模型,无需下载原始代码库。
10月26日消息,腾讯宣布,腾讯大模型迎来全新升级,并正式对外开放“文”功能,展示了其在像自动生成领域的领先能力。升级后的腾讯中文效果整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。
10月26日消息,腾讯宣布,腾讯大模型迎来全新升级,并正式对外开放“文”功能。据介绍,目前已有超过180个内部业务接入腾讯大模型,包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。来自零售、教育、金融、医疗、传媒、交通、政务等多个行业的客户,通过腾讯云调用腾讯API,应用领域涉及智能问答、内容创作、数据分析、代码助手等多个场景。
今日,腾讯大模型(DiT模型)宣布全面开源训练代码,同时对外开源DiTLoRA小规模数据集训练方案与可控制插件ControlNet。
2月7日消息,腾讯宣布“元宝派”将于近期启动春节红包新玩法,用户在派内与元宝互动将有机会获得现金红包。自2月1日元宝APP春节主会场启动以来,元宝AI功能使用率飙升30倍,新用户平均每天跟元宝的互动问答超过8轮,用户单日使用元宝时长增长超80%。不久前,元宝宣布正式接入3.0模型,用户通过元宝APP“创作”入口,还可体验超400套新春创作模版。
4月2日消息,腾讯云副总裁、腾讯大模型负责人刘煜宏表示,多模态大模型将重构内容产业,基于多模态的应用也会百花齐放。他介绍,腾讯大模型技术架构已升级为混合专家模型架构,参数规模达万亿,擅长处理复杂场景和多任务场景。目前正积极发展多模态模型,进一步加强文、文3D以及文/视频能力。同时探索基于大模型全面升级的数智人、语音对话虚拟人、具智能机器人等应用,提升效率和体验。