小红书 AIGC 团队推出全新构造可控生成框架 InstanceAssemble,专为应对复杂场景下的 Layout-to-Image 义务。

同时,InstanceAssemble 采取极轻量的 LoRA 适配方法(仅占 SD3-Medium 3.46%、Flux.1 0.84% 参数),即可在保持底模才能的前提下,实现灵活的文本与参考图多模态控制。我们还构建了全新的 DenseLayout 基准与可解释评价指标 LGS,让构造对齐的评估加倍精确靠得住。

InstanceAssemble 框架经由过程级联构造将文本语义与构造信息分阶段建模,并引入全新的 Assemble-Attention,让模型在面对高密度、多实例构造时依然能保持清楚的空间懂得与精准对齐。

论文标题:InstanceAssemble: Layout-Aware Image Generation via Instance Assembling Attention
论文链接:https://arxiv.org/abs/2509.16691

整体来看,InstanceAssemble 在复杂构造场景下表示稳健,生成质量与可控性均达到业内领先程度。


项目主页:https://github.com/FireRedTeam/InstanceAssemble

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部