2601.21081
2026-06-19
cs.CV
版本更新
70%
Shape of Thought: Progressive Object Assembly via Visual Chain-of-Thought
思维形状:通过视觉思维链进行渐进式物体组装
Yu Huo, Siyu Zhang, Kun Zeng, Haoyue Liu, Owen Lee, Junlin Chen, Yuquan Lu, Yifu Guo, Yaodong Liang, Xiaoying Tang
发表机构
*
School of Science and Engineering, The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)科学与工程学院)
;
School of Data Science, The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)数据科学学院)
;
Sun Yat-sen University(中山大学)
;
The Hong Kong University of Science and Technology, Guangzhou(香港科学与技术大学(广州))
;
Shenzhen Future Network of Intelligence Institute (FNii-Shenzhen)(深圳未来网络智能研究所(FNii-Shenzhen))
;
Guangdong Provincial Key Laboratory of Future Networks of Intelligence, CUHK(SZ)(广东省未来网络智能重点实验室,CUHK(SZ))
专题命中
可控生成
:文本到图像生成中的组合结构约束
AI总结
提出Shape-of-Thought (SoT)框架,通过视觉思维链在渲染2D域中逐步组装形状,解决文本到图像生成中的组合结构约束问题,在组件计数和结构拓扑上显著优于直接生成。