小米正式开源首个原生端到端语音模型
2025-09-19 09:54:40
分享
9月19日消息,小米正式开源首个原生端到端语音模型——Xiaomi-MiMo-Audio。该模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,并在预训练观察到明显的“涌现”行为。后训练进一步激发了Xiaomi-MiMo-Audio的智商、情商、表现力与安全性在内的跨模态对齐能力,语音对话在自然度、情感表达和交互适配上呈现极高的拟人化水准。
更加详细情况,请关注本站最新动态。
9月19日消息,小米正式开源首个原生端到端语音模型——Xiaomi-MiMo-Audio。该模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,并在预训练观察到明显的“涌现”行为。后训练进一步激发了Xiaomi-MiMo-Audio的智商、情商、表现力与安全性在内的跨模态对齐能力,语音对话在自然度、情感表达和交互适配上呈现极高的拟人化水准。