11.14.3.7.2 Diffusion for Layout Control in Text to Image Generation

Chapter Contents (Back)
Difusion Models. Synthesis. Image Synthesis. Text to Image. 2601

Zhou, D.[Dewei], Li, Y.[You], Ma, F.[Fan], Yang, Z.X.[Zong-Xin], Yang, Y.[Yi],
MIGC++: Advanced Multi-Instance Generation Controller for Image Synthesis,
PAMI(47), No. 3, March 2025, pp. 1714-1728.
IEEE DOI 2502
Benchmark testing, Training, Layout, Text to image, Iterative algorithms, Position control, Pipelines, Image synthesis, multimodal learning BibRef

Zhou, D.[Dewei], Li, Y.[You], Ma, F.[Fan], Zhang, X.T.[Xiao-Ting], Yang, Y.[Yi],
MIGC: Multi-Instance Generation Controller for Text-to-Image Synthesis,
CVPR24(6818-6828)
IEEE DOI Code:
WWW Link. 2410
Codes, Attention mechanisms, Aggregates, Pipelines, Layout, Text to image, AIGC, Diffusion Models, Image Generation, Stable Diffusion BibRef

Taghipour, A.[Ashkan], Ghahremani, M.[Morteza], Bennamoun, M.[Mohammed], Rekavandi, A.M.[Aref Miri], Laga, H.[Hamid], Boussaid, F.[Farid],
Box It to Bind It: Unified Layout Control and Attribute Binding in Text-to-Image Diffusion Models,
MultMed(27), 2025, pp. 8393-8407.
IEEE DOI 2511
Layout, Diffusion models, Training, Semantics, Image synthesis, Text to image, Image color analysis, layout guidance BibRef

Zhu, J.Y.[Jing-Yuan], Ma, H.M.[Hui-Min], Chen, J.S.[Jian-Sheng], Yuan, J.[Jian],
Object Detection Data Synthesis via Box-to-Image Generation Based on Diffusion Models,
PAMI(48), No. 1, January 2026, pp. 557-571.
IEEE DOI 2512
Object detection, Diffusion models, Training, Visualization, Motorcycles, Layout, Avatars, Annotations, Training data, diffusion models BibRef

Wang, Z.X.[Zi-Xuan], Peng, D.[Duo], Chen, F.[Feng], Yang, Y.W.[Yu-Wei], Lei, Y.J.[Yin-Jie],
Training-free Dense-Aligned Diffusion Guidance for Modular Conditional Image Synthesis,
CVPR25(13135-13145)
IEEE DOI Code:
WWW Link. 2508
Geometry, Visualization, Solid modeling, Image synthesis, Foundation models, Layout, Virtual reality, Trajectory, Rivers BibRef

Duan, L.[Lunhao], Zhao, S.S.[Shan-Shan], Yan, W.J.[Wen-Jun], Li, Y.[Yinglun], Chen, Q.G.[Qing-Guo], Xu, Z.[Zhao], Luo, W.H.[Wei-Hua], Zhang, K.[Kaifu], Gong, M.M.[Ming-Ming], Xia, G.S.[Gui-Song],
UNIC-Adapter: Unified Image-Instruction Adapter with Multi-Modal Transformer for Image Generation,
CVPR25(7963-7973)
IEEE DOI 2508
Adaptation models, Image synthesis, Layout, Text to image, Transformers, Diffusion models, Data mining BibRef

Patel, Z.[Zakaria], Serkh, K.[Kirill],
Enhancing Image Layout Control with Loss-Guided Diffusion Models,
WACV25(3916-3924)
IEEE DOI 2505
Visualization, Attention mechanisms, Image synthesis, Computational modeling, Layout, Noise, Diffusion models, loss guidance BibRef

Arrabi, A.[Ahmad], Zhang, X.H.[Xiao-Han], Sultani, W.[Waqas], Chen, C.[Chen], Wshah, S.[Safwan],
Cross-View Meets Diffusion: Aerial Image Synthesis with Geometry and Text Guidance,
WACV25(5356-5366)
IEEE DOI Code:
WWW Link. 2505
Geometry, Image segmentation, Costs, Image synthesis, Geology, Computational modeling, Layout, Diffusion models, multimodality BibRef

Guo, D.F.[Dan-Feng], Agarwal, S.[Sanchit], Lin, Y.H.[Yu-Hsiang], Kao, J.Y.[Jiun-Yu], Chung, T.[Tagyoung], Peng, N.[Nanyun], Bansal, M.[Mohit],
Improving Faithfulness of Text-to-Image Diffusion Models through Inference Intervention,
WACV25(4077-4086)
IEEE DOI 2505
Measurement, Accuracy, Computational modeling, Noise reduction, Layout, Retrieval augmented generation, Text to image, Diffusion models BibRef

Wang, Y.L.[Yi-Lin], Chen, Z.Y.[Ze-Yuan], Zhong, L.J.[Liang-Jun], Ding, Z.[Zheng], Tu, Z.W.[Zhuo-Wen],
Dolfin: Diffusion Layout Transformers Without Autoencoder,
ECCV24(LI: 326-343).
Springer DOI 2412
BibRef

Iwai, S.[Shoma], Osanai, A.[Atsuki], Kitada, S.[Shunsuke], Omachi, S.[Shinichiro],
Layout-corrector: Alleviating Layout Sticking Phenomenon in Discrete Diffusion Model,
ECCV24(XXXIV: 92-110).
Springer DOI 2412
BibRef

Shabani, M.A.[Mohammad Amin], Wang, Z.W.[Zhao-Wen], Liu, D.[Difan], Zhao, N.X.[Nan-Xuan], Yang, J.[Jimei], Furukawa, Y.[Yasutaka],
Visual Layout Composer: Image-Vector Dual Diffusion Model for Design Layout Generation,
CVPR24(9222-9231)
IEEE DOI Code:
WWW Link. 2410
Visualization, Computational modeling, Layout, Diffusion models, Controllability, Vectors BibRef

Ren, J.W.[Jia-Wei], Xu, M.M.[Meng-Meng], Wu, J.C.[Jui-Chieh], Liu, Z.W.[Zi-Wei], Xiang, T.[Tao], Toisoul, A.[Antoine],
Move Anything with Layered Scene Diffusion,
CVPR24(6380-6389)
IEEE DOI 2410
Codes, Layout, Noise reduction, Memory management, Text to image, Process control BibRef

Habibian, A.[Amirhossein], Ghodrati, A.[Amir], Fathima, N.[Noor], Sautiere, G.[Guillaume], Garrepalli, R.[Risheek], Porikli, F.M.[Fatih M.], Petersen, J.[Jens],
Clockwork Diffusion: Efficient Generation With Model-Step Distillation,
CVPR24(8352-8361)
IEEE DOI Code:
WWW Link. 2410
Training, Adaptation models, Runtime, Noise reduction, Semantics, Layout, Text to image, diffusion, efficient diffusion, distillation BibRef

Phung, Q.[Quynh], Ge, S.W.[Song-Wei], Huang, J.B.[Jia-Bin],
Grounded Text-to-Image Synthesis with Attention Refocusing,
CVPR24(7932-7942)
IEEE DOI 2410
Visualization, Large language models, Computational modeling, Layout, Text to image, Benchmark testing, Diffusion models, grounded text-to-image BibRef

Gong, B.[Biao], Huang, S.[Siteng], Feng, Y.T.[Yu-Tong], Zhang, S.W.[Shi-Wei], Li, Y.[Yuyuan], Liu, Y.[Yu],
Check, Locate, Rectify: A Training-Free Layout Calibration System for Text- to- Image Generation,
CVPR24(6624-6634)
IEEE DOI Code:
WWW Link. 2410
Image synthesis, Layout, Pipelines, Text to image, Benchmark testing, Diffusion models, Generators, text-to-image generation, training-free BibRef

Shirakawa, T.[Takahiro], Uchida, S.[Seiichi],
NoiseCollage: A Layout-Aware Text-to-Image Diffusion Model Based on Noise Cropping and Merging,
CVPR24(8921-8930)
IEEE DOI Code:
WWW Link. 2410
Image synthesis, Image edge detection, Noise, Layout, Noise reduction, Merging, Text to image, diffusion model, text-to-image generation BibRef

Sueyoshi, K.[Kota], Matsubara, T.[Takashi],
Predicated Diffusion: Predicate Logic-Based Attention Guidance for Text-to-Image Diffusion Models,
CVPR24(8651-8660)
IEEE DOI 2410
Image quality, Image synthesis, Natural languages, Layout, Text to image, Diffusion models, text-to-image generation, attention guidance BibRef

Yang, B.B.[Bin-Bin], Luo, Y.[Yi], Chen, Z.L.[Zi-Liang], Wang, G.R.[Guang-Run], Liang, X.D.[Xiao-Dan], Lin, L.[Liang],
LAW-Diffusion: Complex Scene Generation by Diffusion with Layouts,
ICCV23(22612-22622)
IEEE DOI 2401
BibRef

Levi, E.[Elad], Brosh, E.[Eli], Mykhailych, M.[Mykola], Perez, M.[Meir],
DLT: Conditioned layout generation with Joint Discrete-Continuous Diffusion Layout Transformer,
ICCV23(2106-2115)
IEEE DOI Code:
WWW Link. 2401
BibRef

Couairon, G.[Guillaume], Careil, M.[Marlène], Cord, M.[Matthieu], Lathuilière, S.[Stéphane], Verbeek, J.[Jakob],
Zero-shot spatial layout conditioning for text-to-image diffusion models,
ICCV23(2174-2183)
IEEE DOI 2401
BibRef

Chai, S.[Shang], Zhuang, L.S.[Lian-Sheng], Yan, F.Y.[Feng-Ying],
LayoutDM: Transformer-based Diffusion Model for Layout Generation,
CVPR23(18349-18358)
IEEE DOI 2309
BibRef

Hui, M.[Mude], Zhang, Z.Z.[Zhi-Zheng], Zhang, X.Y.[Xiao-Yi], Xie, W.X.[Wen-Xuan], Wang, Y.W.[Yu-Wang], Lu, Y.[Yan],
Unifying Layout Generation with a Decoupled Diffusion Model,
CVPR23(1942-1951)
IEEE DOI 2309
BibRef

Zheng, G.C.[Guang-Cong], Zhou, X.P.[Xian-Pan], Li, X.W.[Xue-Wei], Qi, Z.A.[Zhong-Ang], Shan, Y.[Ying], Li, X.[Xi],
LayoutDiffusion: Controllable Diffusion Model for Layout-to-Image Generation,
CVPR23(22490-22499)
IEEE DOI 2309
BibRef

Chapter on 3-D Object Description and Computation Techniques, Surfaces, Deformable, View Generation, Video Conferencing continues in
Diffusion for High Resoluion, Super-Resolution Image Generation .

Last update:Jul 6, 2026 at 19:51:11