小米开源首个原生端到端语音模型

刘峰
2025-09-19 09:54

小米正式开源首个原生端到端语音模型——Xiaomi-MiMo-Audio。

小米表示,该模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,并在预训练观察到明显的“涌现”行为。后训练进一步激发了Xiaomi-MiMo-Audio的智商、情商、表现力与安全性在内的跨模态对齐能力,语音对话在自然度、情感表达和交互适配上呈现极高的拟人化水准。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:Xiaomi MiMo公众号

在通用语音理解及对话等多项标准评测基准中,MiMo-Audio大幅超越了同参数量的开源模型,取得7B最佳性能;在音频理解基准MMAU的标准测试集上,MiMo-Audio超过Google闭源语音模型Gemini-2.5-Flash;在面向音频复杂推理的基准Big Bench Audio S2T任务中,MiMo-Audio超越了OpenAI闭源语音模型GPT-4o-Audio-Preview。

从创新贡献上来看,Xiaomi-MiMo-Audio首次证明把语音无损压缩预训练Scaling至1亿小时可以“涌现”出跨任务的泛化性,表现为Few-Shot Learning能力;首个明确语音生成式预训练的目标和定义,并开源了一套完整的语音预训练方案,包括无损压缩的Tokenizer、全新模型结构、训练方法和评测体系;首个把Thinking同时引入语音理解和语音生成过程中的开源模型,支持混合思考。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:Xiaomi MiMo公众号

此次开源,进一步推动MiMo与早前开源的Vela物联网系统、米家智能家居协议深度绑定。对开发者来说,基于MiMo开发的语音助手,未来可直接接入小米智能家居设备,或借助车载推理引擎无缝对接小米汽车OS系统。

自2016年组建AI团队以来,小米人工智能团队经过7年6次扩展,相关领域人员规模已达3000多人,其AI技术能力已覆盖视觉、声学、语音、NLP、知识图谱、机器学习、大模型、多模态方向,并逐步接入手机、汽车、AIoT、机器人等业务板块。2023年4月,小米AI实验室大模型团队正式组建,栾剑担任大模型团队负责人。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
小米首个推理模型开源
5月14日消息,天眼查资料显示,近日,小米科技有限责任公司申请注册多枚“XIAOMI MIMO”商标,国际分类为运输工具、科学仪器、通讯服务等,当前商标状态均为等待实质审查。公开信息显示,Xiaomi MiMo小米首个推理模型,联动预训练到后训练,全面提升推理能力,于2025年4月30日开源
8月4日消息,小米发布和全量开源了MiDashengLM-7B模型。MiDashengLM-7B声音理解性能在22个公开评测集上刷新多模态模型最好成绩(SOTA),单样本推理的首Token延迟(TTFT)仅为业界先进模型的1/4,同等显存下的数据吞吐效率是业界先进模型的20倍以上。在当前版本的基础上,小米已着手对该模型做计算效率的进一步升级,寻求终端设备上可离线部署,并完善基于用户自然语言提示的声音编辑等更全面的功能。
12月21日消息,据第一财经《新皮层》消息,DeepSeek开源模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米AI实验室,领导小米模型团队。知情人士称,雷军认为小米模型领域发力太晚,于是亲自挖人,重金招募能够领军小米模型的人才,支付的薪酬水平在千万元级别。小米AI实验室正式成立于2016年年初,目前团队大约有250人,研究方向包括视觉、声学、语音、自然语言处理、知识图谱、机器学习和模型
好戏才刚刚开始。
5月9日消息,阿里云公布了一组最新数据,通义模型通过阿里云服务企业超9万,通义开源模型累计下载量突破700万。此外,通义落地应用进程加速,现已进入PC、手机、汽车、航空等领域。小米旗下的人工智能助手“小爱同学”已与阿里云通义模型达成合作。微博、完美世界游戏等企业也宣布接入通义模型
4月14日消息,摩根士丹利 表示,将小米集团评级上调至超配,目标价31.50港元。截至今日开盘前,小米集团港股跌0.20%,报24.90港元/股,目前总市值为6275.89亿港元。
3月8日消息,《电商报》获悉,小米集团今日开盘一度跌超4%,截至北京时间上午10时09分跌,报港元,市值为亿港元。后小米方面进行辟谣,股价应声下跌。3月5日,小米集团出现2宗手成交,每股作价港元及港元,共涉及500万股,共涉资亿港元。截至当日港股收盘,小米集团下跌,报港元,总市值为亿港元。此前据知情人士透露,小米首款折叠手机即将发布。
《电商报》获悉,据了解,自小米造车传闻后,小米股价屡次出现波动。小米集团今日开盘一度跌超4%,盘中不断下跌,截至今日收盘,已跌超8%。据报道,小米股票通过大宗交易以每股23港元成交400万股。3月5日,小米集团出现2宗手成交,每股作价港元及港元,共涉及500万股,共涉资亿港元。截至当日港股收盘,小米集团下跌,报港元,总市值为亿港元。