字节跳动与南洋理工大年夜学开源 StoryMem 框架

83 阅读 0 评论 0 点赞

字节跳动与南洋理工大年夜学结合宣布开源AI视频生成框架StoryMem，经由过程“Memory-to-Video（M2V）”机制，将单镜头扩散模型进级为支撑多镜头、超1分钟连贯叙事的长视频生成体系。

该框架应用动态记忆库存储关键帧信息，结合轻量LoRA微调，在角色表面、场景风格和叙事逻辑上实现跨镜头高度一致，一致性指标较现有办法晋升29%。

开源地址：https://github.com/Kevin-thu/StoryMem

配套宣布的ST-Bench数据集含300个多镜头故事提示，支撑标准化评估。社区已开端在ComfyUI中集成该技巧。

点赞(0) 打赏

本文分类：互联网
本文标签：字节跳动与南洋理工大学开源 StoryMem 框架
浏览次数：83 次浏览
发布日期：2025-12-30 08:43:39
本文链接：https://www.fqpy.com/internet/3458

上一篇 > KDE Plasma 的 Wayland 迁徙工作“即将完成”
下一篇 > 字节 Trae 宣布《2025 年度产品申报》

评论列表共有 0 条评论

暂无评论

发表评论取消回复

微信小程序

微信扫一扫体验

微信公众账号

微信扫一扫加关注

发表
评论返回
顶部