视觉与机器人
图像生成
图像生成、文生图、图像编辑、扩散模型和可控生成。
FlowBender: Feedback-Aware Training for Self-Correcting Conditional Flows
FlowBender: 面向自校正条件流的反馈感知训练
专题命中 图像编辑 :反馈感知训练用于条件流模型,提升图像翻译和修复
AI总结 针对条件扩散/流模型常违反任务约束的问题,提出FlowBender闭环框架,将对齐误差作为输入训练网络学习校正策略,在图像翻译、复原和3D纹理贴图中同时提升保真度与合理性。
Comments Project page: https://flow-bender.github.io/
Relighting as a Probe of Visual Priors via Augmented Latent Intrinsics
通过增强潜在本征属性将重光照作为视觉先验的探针
专题命中 图像编辑 :重光照属于图像编辑范畴
AI总结 提出增强潜在本征属性(ALI)方法,融合密集像素对齐视觉特征到潜在本征重光照模型,平衡语义与光度保真度,提升复杂材质重光照质量。
Comments Camera-ready version for ICML 2026. Project page: https://augmented-latent-intrinsics.github.io
Thinking in Boxes: 3D Editing in Real Images Made Easy
Thinking in Boxes: 真实图像中的3D编辑变得简单
专题命中 图像编辑 :基于3D盒子的图像编辑方法。
AI总结 提出使用3D盒子作为结构化规范,通过用户提供输入和输出盒子来精确控制真实图像中的平移、旋转、缩放和视角变化,同时保持场景和物体身份,恢复未见的物体区域。
Comments Project Page: https://thinking-in-boxes.github.io/