腾讯将发布全球首个全模态模型“混元-O”

田宁
2025-05-25 17:40

腾讯自研大模型“混元”要发力“全模态”。

据钛媒体消息,基于腾讯自研大模型混元的首个端到端语音通话模型Hunyuan-Voice,最快今年6月上线腾讯元宝App,从而与豆包AI视频通话功能对抗。而且,腾讯已规划多模态和全模态路线,最快今年将推出全球首个“全模态模型”,代号为混元-O,瞄向“世界模型”。

电商派

图源:钛媒体

隶属于腾讯TEG(技术工程)事业群的腾讯混元科研人员透露,面向AGI,混元将以语言模型为核心,探索多种模态融合,并将向深度、广度两方面持续推进探索。一方面,混元从大语言模型向多模态模型发展,理解和模拟物理世界;同时,混元还将瞄准更智能的推理、规划、智能体,以及探索知识边界,自我启发、自我迭代、自我发现,最终与具身智能等技术结合,向环境中自主行动和学习的世界模型方向进行探索。

这是首个披露腾讯混元最新规划的消息,在此之前,腾讯没有对外披露过混元-O全模态模型技术。

自2024年起,腾讯的AI战略进入重投入期。其2024年财报显示,公司全年研发投入达706.9亿元,七年累计投入达3403亿元;资本开支连续四个季度实现同比三位数增长,年度资本开支更突破767亿元,同比增长221%,创历史新高。其中,AI项目发展所涉及的资本开支就达390亿元。腾讯总裁刘炽平表示,腾讯计划2025年进一步加大资本开支,预计会占2025年总收入的“低两位数百分比”。这意味着,2025年腾讯的资本开支可能接近1000亿元的水平。

电商派

图源:钛媒体

除了腾讯,阿里、字节都在加大AI研发投入力度。阿里巴巴集团CEO吴泳铭已经宣布,未来三年,阿里将投入超过3800亿元,用于建设云和AI硬件基础设施,总额超过去十年总和。这也创下中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模投资纪录。

电商派

图源:阿里足迹官网

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
4月1日消息,顺丰同城宣布在业务的各个环节推进运营数字化和AI决策智能化,建立起更适配即时配送领域的大模型基座,应用大模型技术面向场景业务和生态链参与者。据介绍,依托DeepSeek的开源生态及多模态AI能力,顺丰同城实现快速定制化开发,精准匹配不同客户的差异化需求,显著缩短项目落地周期。目前,除了DeepSeek,顺丰同城已与火山豆包、腾讯等国内多个厂商达成合作,通过多个大模型对比验证,持续优化AI应用效果。
1月30日消息,新加坡Sea AI Lab高级研究科学家庞天宇加盟腾讯,任腾讯的首席研究科学家和多模态强化学习技术负责人,主要研究方向为多模态模型的强化学习,包括生成模型和理解模型。其加盟的模态部 Exploration Center,主要承担强化学习前沿算法探索任务。公开信息显示,庞天宇是清华大学计算机系2017级直博生,师从朱军教授。主要研究方向为机器学习,特别是深度学习以及其鲁棒性的研究,取得了一系列的研究成果。
11月25日消息,腾讯推出全新开源模型HunyuanOCR,参数仅为1B,依托于原生多模态架构打造,获得多项业界OCR应用榜单SOTA(最先进水平)成绩。HunyuanOCR具有高度易用性,不仅体积小,便于部署,得益于原生多模态模型"端到端"的理念设计,各项功能仅需单次向推理即可直达最优结果,较业界级联方案更高效和便捷,性价比高。
据“AI科技评论”公众号,胡瀚不久前加入腾讯,接替已离职的腾讯模型技术负责人之一的刘威,负责多模态模型的研发工作。
2月20日消息,腾讯元宝再次迎来更新:深度思考模型腾讯T1”已量上线。据介绍,腾讯T1和DeepSeek-R1同为推理模型,专为复杂任务设计,能够理解问题的多重维度和潜在逻辑关系,并进行逻辑推理。目前,在腾讯元宝,+DeepSeek两大模型均已全线支持通用任务、深度思考能力。用户通过腾讯元宝,不仅可以使用DeepSeek-R1满血版、T1进行深度思考,也可使用DeepSeek-V3、腾讯Turbo快速输出答案。
3月19日消息,腾讯云上海峰会期间,腾讯集团副总裁、政企业务总裁李强表示,腾讯云将加码华东区域布局。在华东地区,腾讯云已落地国内最大GPU算力中心、青浦数据中心、仪征数据中心,为长三角企业提供算力支撑,并依托“腾讯模型+开源模型”多模行业方案,提供栈智能工具箱,助力客户创新提效。此外,腾讯云还通过“6T”栈融合创新软件体系,在政企、能源、医疗、交通、教育等行业应用,助力长三角产业自主创新发展。
12月17日消息,腾讯世界模型1.5(Tencent HY WorldPlay)正式发布。世界模型1.5(WorldPlay)首次开源了业界最系统、最全面的实时世界模型框架,涵盖数据、训练、流式推理部署等链路、环节,并提出了重构记忆力、长上下文蒸馏、基于3D的自回归扩散模型强化学习等算法模块。 
3月18日消息,腾讯宣布推出5个全新3D生成模型模型生成速度更快、细节更丰富、材质表达更逼真,并且全部开源。同时,其自的3D AI创作引擎也迎来升级,新增多视图输入、模型智能减面、格式兼容等能力,面向C端用户全面开放使用。据了解,5个开源模型均基于Hunyuan3D-2.0打造,其中Turbo系列模型在保证高精度和高质量的基础上,对几何生成模型进行了数十倍的加速,确保整个生成过程能够在30秒内完成。