首页 > 人才学识 > 人才学识 > 美团LongCat-Video视频生成模型发布:可输出5分钟长视频

美团LongCat-Video视频生成模型发布:可输出5分钟长视频

发布时间:2025-10-30 19:25:32

10月27日,美团官方宣布,美团LongCat团队正式发布LongCat-Video视频生成模型。该模型基于Diffusion Transformer架构,可支持文生视频、图生视频及视频续写三类核心任务,并宣称在开源模型中达到先进水平。

据介绍,LongCat-Video可生成720p分辨率、30帧率的高清视频,其突出特点在于能够原生生成长达5分钟的连贯视频内容。模型通过视频续写预训练、块稀疏注意力等机制,旨在解决长视频生成中常见的画面断裂、质量下降等问题,保持时序一致性与运动合理性。

在效率方面,该模型采用二阶段生成、块稀疏注意力及模型蒸馏等技术,据官方表示推理速度提升超过10倍。模型参数量为136亿,在VBench等公开测试中表现出较强的文本对齐与运动连贯性。

作为构建"世界模型"的技术尝试,LongCat-Video未来或可应用于自动驾驶模拟、具身智能等需要长时序建模的场景。该模型的发布标志着美团在视频生成与物理世界模拟领域迈出重要一步。

人才学识更多>>

工程化的长期主义:OceanBase十五年沉淀,如何成为AI时代的数据基石? 具身开放日点燃生态引擎,智源以开源开放驱动具身智能创新 一文读懂:为什么Nano Banana Pro重新定义了AI图像生成标准|巴伦精选 对话杨元庆:AI不存在泡沫,2026年存储芯片价格还会持续上涨 当存储涨疯了,国产屏的红利缓解了手机、PC厂商的焦虑 上汽大众押注 ID. ERA,杀入增程 9 系主战场 当技术开始“说人话”,一汽丰田如何油电共进? 广州车展上的江淮汽车:用产品矩阵展现硬实力,用全球化彰显大格局 双11第一周服饰数据出炉,谁是赢家? 何小鹏怒剪机器人,特斯拉从此有了新对手 蚂蚁集团宣布架构调整:健康板块升格为事业群,成“第五大支柱” 奥林巴斯将在全球范围裁员7%,约2000名员工受影响 2027后量产,三星电机、住友化学签封装基板玻璃芯合资生产MOU 小鹏女性机器人为啥走路如此轻盈 全裸揭晓答案 黄仁勋表态中国将赢得AI竞赛!专家:别被带跑了 他实际另有所图 “吉林一号”卫星俯瞰吉林老家:天际线下的新高度 宇树王兴兴、中微尹志尧、强脑韩璧丞等被上交所聘任咨询委委员 哈啰顺风车小程序审核有BUG?驾照、行驶证免审,填假信息也能接单 亚马逊再挥裁员大刀,或创2022年来最大规模 一加15发布:携第五代骁龙8至尊版与165Hz游戏生态登场,3999元起 消息称半固态电池将统一命名为固液电池 市场规模将达到10万辆级 美团LongCat-Video视频生成模型发布:可输出5分钟长视频 深蓝L06预售发布会官宣:超跑同款磁流变悬架 1000次/秒高频调节 彭博:中国自动驾驶出租车企业加速出海,美国巨头已落后 中国国家版本馆携青岛出版集团:版博会上“哪吒闹海”,趣探文化精粹雅韵 九旬王蒙现身天府书展神侃“聊斋” 相声式阐释“极限”写作引满堂彩 四大名著讲尽人生 茅奖作家刘亮程:我永远不会让读者流泪 苏州黄埭镇书写着传统曲艺的当代传奇 相约北京图书市集,共赴一场“未完成”的秋日叙事