小红书 AIGC 团队推出全新构造可控生成框架 InstanceAssemble,专为应对复杂场景下的 Layout-to-Image 义务。



同时,InstanceAssemble 采取极轻量的 LoRA 适配方法(仅占 SD3-Medium 3.46%、Flux.1 0.84% 参数),即可在保持底模才能的前提下,实现灵活的文本与参考图多模态控制。我们还构建了全新的 DenseLayout 基准与可解释评价指标 LGS,让构造对齐的评估加倍精确靠得住。


InstanceAssemble 框架经由过程级联构造将文本语义与构造信息分阶段建模,并引入全新的 Assemble-Attention,让模型在面对高密度、多实例构造时依然能保持清楚的空间懂得与精准对齐。
论文标题:InstanceAssemble: Layout-Aware Image Generation via Instance Assembling Attention
论文链接:https://arxiv.org/abs/2509.16691
整体来看,InstanceAssemble 在复杂构造场景下表示稳健,生成质量与可控性均达到业内领先程度。
项目主页:https://github.com/FireRedTeam/InstanceAssemble

发表评论 取消回复