小米开源声音理解大模型MiDashengLM-7B

2025-08-04 11:59:40

8月4日消息，小米发布和全量开源了MiDashengLM-7B模型。MiDashengLM-7B声音理解性能在22个公开评测集上刷新多模态大模型最好成绩（SOTA），单样本推理的首Token延迟（TTFT）仅为业界先进模型的1/4，同等显存下的数据吞吐效率是业界先进模型的20倍以上。在当前版本的基础上，小米已着手对该模型做计算效率的进一步升级，寻求终端设备上可离线部署，并完善基于用户自然语言提示的声音编辑等更全面的功能。

[查看原文]

更加详细情况，请关注本站最新动态。

7X24h快讯

申通快递福建省分公司开展全区域反诈普及工作
1小时前
“什么值得买”发布《2026家生活兴趣报告》
1小时前
敦煌网新增The elf on the shelf、Ford品牌知识产权保护
1小时前
小红书开源大模型强化学习训练引擎Relax
1小时前
新世界旗下Gmarket与阿里合资后GMV实现双位数增长
1小时前
大华继显降阿里健康目标价至6港元下调盈测反映创新药及AI投资增加
2小时前
星展：升极兔速递-W目标价至13.5港元
2小时前
韩国电商11Street将进驻京东全球购
2小时前
淘天在上海成立新供应链科技公司注册资本500万元
2小时前
LankaPay、斯里兰卡旅游局与Alipay+达成合作
2小时前