阿里通义首个音频生成模型ThinkSound正式开源

2025-07-05 17:11:19

7月5日消息，阿里“通义大模型”公众号发文宣布，通义实验室首个音频生成模型ThinkSound现已正式开源，将打破“静音画面”的想象力局限。ThinkSound首次将CoT（Chain-of-Thought，思维链）应用到音频生成领域，让AI学会一步步“想清楚”画面事件与声音之间的关系，从而实现高保真、强同步的空间音频生成——不只是“看图配音”，而是真正“听懂画面”。

[查看原文]

更加详细情况，请关注本站最新动态。

7X24h快讯

抖音即时零售“次日达”店铺停运融入主站电商体系
4分钟前
可灵AI推出会员模型优惠计划
18分钟前
阿里巴巴图像生成与编辑统一模型Wan2.7-Image发布
25分钟前
招银国际升极兔速递目标价至14.7港元去年业绩胜预期
26分钟前
同程旅行：清明黄金周亲子人群度假产品订单翻倍
28分钟前
中通总部举办网点安全能力提升集训
28分钟前
中交电商公司获“国家级高新技术企业发展研发补助”
32分钟前
天津交通部门约谈哈啰单车
35分钟前
青岛跨境电商OPC服务专区上线
42分钟前
阿里资产房产与大连市拍卖行业协会达成战略合作
45分钟前