腾讯将发布全球首个全模态模型“混元-O”

田宁

2025-05-25 17:40

腾讯自研大模型“混元”要发力“全模态”。

据钛媒体消息，基于腾讯自研大模型混元的首个端到端语音通话模型Hunyuan-Voice，最快今年6月上线腾讯元宝App，从而与豆包AI视频通话功能对抗。而且，腾讯已规划多模态和全模态路线，最快今年将推出全球首个“全模态模型”，代号为混元-O，瞄向“世界模型”。

电商派

图源：钛媒体

隶属于腾讯TEG（技术工程）事业群的腾讯混元科研人员透露，面向AGI，混元将以语言模型为核心，探索多种模态融合，并将向深度、广度两方面持续推进探索。一方面，混元从大语言模型向多模态模型发展，理解和模拟物理世界；同时，混元还将瞄准更智能的推理、规划、智能体，以及探索知识边界，自我启发、自我迭代、自我发现，最终与具身智能等技术结合，向环境中自主行动和学习的世界模型方向进行探索。

这是首个披露腾讯混元最新规划的消息，在此之前，腾讯没有对外披露过混元-O全模态模型技术。

自2024年起，腾讯的AI战略进入重投入期。其2024年财报显示，公司全年研发投入达706.9亿元，七年累计投入达3403亿元；资本开支连续四个季度实现同比三位数增长，年度资本开支更突破767亿元，同比增长221%，创历史新高。其中，AI项目发展所涉及的资本开支就达390亿元。腾讯总裁刘炽平表示，腾讯计划2025年进一步加大资本开支，预计会占2025年总收入的“低两位数百分比”。这意味着，2025年腾讯的资本开支可能接近1000亿元的水平。

电商派

图源：钛媒体

除了腾讯，阿里、字节都在加大AI研发投入力度。阿里巴巴集团CEO吴泳铭已经宣布，未来三年，阿里将投入超过3800亿元，用于建设云和AI硬件基础设施，总额超过去十年总和。这也创下中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模投资纪录。

电商派

图源：阿里足迹官网

腾讯腾讯混元全模态模型

声明

1、该内容为作者独立观点，不代表电商派观点或立场，文章为作者本人上传，版权归原作者所有，未经允许不得转载。
2、电商号平台仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。
3、如对本稿件有异议或投诉，请联系：info@dsb.cn

相关阅读

顺丰同城：已与火山豆包、腾讯混元等国内多个厂商达成合作

2025-04-01 14:13:19

4月1日消息，顺丰同城宣布在业务的各个环节推进运营数字化和AI决策智能化，建立起更适配即时配送领域的大模型基座，应用大模型技术面向全场景业务和全生态链参与者。据介绍，依托DeepSeek的开源生态及多模态AI能力，顺丰同城实现快速定制化开发，精准匹配不同客户的差异化需求，显著缩短项目落地周期。目前，除了DeepSeek，顺丰同城已与火山豆包、腾讯混元等国内多个厂商达成合作，通过多个大模型对比验证，持续优化AI应用效果。

AI大牛庞天宇加盟腾讯任混元大模型首席研究科学家

2026-01-30 14:24:17

1月30日消息，前新加坡Sea AI Lab高级研究科学家庞天宇加盟腾讯，任腾讯混元的首席研究科学家和多模态强化学习技术负责人，主要研究方向为多模态模型的强化学习，包括生成模型和理解模型。其加盟的混元多模态部 Exploration Center，主要承担强化学习前沿算法探索任务。公开信息显示，庞天宇是清华大学计算机系2017级直博生，师从朱军教授。主要研究方向为机器学习，特别是深度学习以及其鲁棒性的研究，取得了一系列的研究成果。

腾讯混元推出全新开源模型HunyuanOCR

2025-11-25 14:31:43

11月25日消息，腾讯混元推出全新开源模型HunyuanOCR，参数仅为1B，依托于混元原生多模态架构打造，获得多项业界OCR应用榜单SOTA（最先进水平）成绩。HunyuanOCR具有高度易用性，不仅体积小，便于部署，得益于混元原生多模态大模型"端到端"的理念设计，各项功能仅需单次前向推理即可直达最优结果，较业界级联方案更高效和便捷，性价比高。

前微软亚研院视觉专家胡瀚加入腾讯负责多模态大模型研发

2025-01-08 15:08:35

据“AI科技评论”公众号，胡瀚不久前加入腾讯，接替已离职的前腾讯混元大模型技术负责人之一的刘威，负责多模态大模型的研发工作。

深度思考模型“腾讯混元T1”已全量上线

2025-02-20 09:21:23

2月20日消息，腾讯元宝再次迎来更新：深度思考模型“腾讯混元T1”已全量上线。据介绍，腾讯混元T1和DeepSeek-R1同为推理模型，专为复杂任务设计，能够理解问题的多重维度和潜在逻辑关系，并进行逻辑推理。目前，在腾讯元宝，混元+DeepSeek两大模型均已全线支持通用任务、深度思考能力。用户通过腾讯元宝，不仅可以使用DeepSeek-R1满血版、混元T1进行深度思考，也可使用DeepSeek-V3、腾讯混元Turbo快速输出答案。

腾讯集团李强：腾讯云将加码华东区域布局

2025-03-19 14:14:21

3月19日消息，腾讯云上海峰会期间，腾讯集团副总裁、政企业务总裁李强表示，腾讯云将加码华东区域布局。在华东地区，腾讯云已落地国内最大GPU算力中心、青浦数据中心、仪征数据中心，为长三角企业提供算力支撑，并依托“腾讯混元大模型+开源模型”多模行业方案，提供全栈智能工具箱，助力客户创新提效。此外，腾讯云还通过“6T”全栈融合创新软件体系，在政企、能源、医疗、交通、教育等行业应用，助力长三角产业自主创新发展。

腾讯混元世界模型1.5发布

2025-12-17 14:17:32

12月17日消息，腾讯混元世界模型1.5（Tencent HY WorldPlay）正式发布。混元世界模型1.5（WorldPlay）首次开源了业界最系统、最全面的实时世界模型框架，涵盖数据、训练、流式推理部署等全链路、全环节，并提出了重构记忆力、长上下文蒸馏、基于3D的自回归扩散模型强化学习等算法模块。

腾讯混元推出5款3D生成模型并全部开源

2025-03-18 15:21:47

3月18日消息，腾讯混元宣布推出5个全新3D生成模型，模型生成速度更快、细节更丰富、材质表达更逼真，并且全部开源。同时，其自研的3D AI创作引擎也迎来升级，新增多视图输入、模型智能减面、格式全兼容等能力，面向C端用户全面开放使用。据了解，5个开源模型均基于Hunyuan3D-2.0打造，其中Turbo系列模型在保证高精度和高质量的基础上，对几何生成模型进行了数十倍的加速，确保整个生成过程能够在30秒内完成。

田宁

电商脉搏，媒体前沿洞察。