美团发布视频生成模型LongCat-Video

田宁
2025-10-27 11:02

10月27日消息,美团LongCat团队正式发布LongCat-Video视频生成模型。作为一款视频生成模型,LongCat-Video凭借其精准重构真实世界运行状态的能力,正在成为美团探索世界模型的第一步,也是关键的一步。同时,这也为后续支撑更多自动驾驶、具身智能等深度交互业务场景,夯实了技术基础。

电商派

图源:龙猫LongCat公众号

作为基于Diffusion Transformer(DiT)架构的多功能统一视频生成基座,LongCat-Video创新通过 “条件帧数量” 实现任务区分 —— 文生视频无需条件帧、图生视频输入1帧参考图、视频续写依托多帧前序内容,原生支持三大核心任务且无需额外模型适配,形成 “文生 / 图生 / 视频续写” 完整任务闭环。

据介绍,依托视频续写任务预训练、Block-Causual Attention机制和 GRPO后训练,LongCat-Video可稳定输出5分钟级别的长视频,且无质量损失,达到行业顶尖水平。同时,从根源规避色彩漂移、画质降解、动作断裂等行业痛点,保障跨帧时序一致性与物理运动合理性,完美适配数字人、具身智能、世界模型等需要长时序动态模拟的场景需求。同时,模型结合块稀疏注意力(BSA)与条件 token 缓存机制,大幅降低长视频推理冗余 —— 即便处理93帧及以上长序列,仍能兼顾效率与生成质量稳定,打破长视频生成 “时长与质量不可兼得” 的瓶颈。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
2月16日消息,OpenAI今日推出一款全新的文本到视频生成模型Sora,该模型允许用户创建长达一分钟的逼真视频。根据OpenAI的介绍性博客文章,Sora能够创建具有多个角色、特定运动类型以及主题和背景的准确细节的复杂场景。针对该模型,360董事长周鸿祎表示,Sora将对短视频行业有巨大的颠覆,但未必能击败TikTok,更多是创作力工具。此外,周鸿祎认为,中两国的人工智能差距在拉大。
7月31日消息,快手视频生成模型可灵AI宣布正式推出全球会员服务,针对不同类别的会员,提供相应的专属功能。可灵官网显示,全球会员体系与国内相似,也分为三个类别,以月卡为例,三档会员价格分别为10美元、37美元和92美元,对应分别获得660、3000 、8000“灵感值”,可生成约66个、300个或800个5s高性能视频。除月卡外,还提供季卡、半年卡、年卡等多种套餐。
6月14日消息,天眼查信息显示,今日,关联公司北京三快在线科技有限公司公开一项“短视频广告生成方法、装置、电子设备及可读存储介质”专利,申请公布号为CN114630188A,申请日期为2022年2月18日。该专利摘要显示,本公开的实施例可以快速、高效生成视频广告,可以批量化生产出成千上万个短视频广告,满足无能力制作短视频广告的商户需求。
8月22日消息,成都高新区将联合发放总额2000万元“嗨高新·潮成都”金秋消费券,开展多项促消费活动,补贴市民餐饮、旅游、零售等多领域的消费需求,助力消费提振。消费券共将分为9个批次发放,将从8月22日持续至10月13日,覆盖堂食餐饮、酒店住宿、景区门票、日用零售、商场购物、体育消费等多个领域。8月22日上午10点起,市民可上App和大众点评App,搜索“成都高新消费券”参与抢券。
3月31日消息,近期,苏州市市监局公布“青”专项抽检结果。本次抽检了7家生产环节地产企业,27家餐饮环节单位以及包括饿了么、、淘宝等网络购买平台在内的33家流通环节经营单位。据悉,本次“青”专项抽检结合广大市民消费热点,在生产加工、市场流通、餐饮服务三个环节抽取青共计72批次产品,抽样覆盖四市六区十个板块,结果显示为全部合格,合格率100%。
6月13日消息,百度盘前涨4.78%,报140.78美元。百度宣布推出智能电商品牌百度优选,与苏宁易购达成合作。苏宁易购以618为契机将全品类超百万款商品接入百度优选,并覆盖搜索、直播、视频商城等多个场域。后续双方还将共同发力智能电商。
8月3日消息,有市场消息称,泛娱乐生态进一步整合,短视频部门与游戏小说部门合并。