视觉与机器人
图像生成
图像生成、文生图、图像编辑、扩散模型和可控生成。
Pixel-Level Residual Diffusion Transformer: Scalable 3D CT Volume Generation
像素级残差扩散Transformer:可扩展的3D CT体生成
专题命中 扩散模型 :基于扩散Transformer的3D图像生成
AI总结 提出像素级残差扩散Transformer(PRDiT),通过两阶段训练(局部MLP盲估计器分离低频结构+全局残差扩散Transformer建模高频残差)实现高保真3D CT体生成,在LIDC-IDRI和RAD-ChestCT数据集上优于现有方法。
Comments Accepted at ICLR 2026. Code available at https://github.com/Fredy-Zhang/PRDiT