图像生成 - arXivDaily 专题

2606.20094 2026-06-19 cs.CV cs.AI cs.GR cs.LG cs.MM 新提交专题 90

MakeupMirror: Improving Facial Attribute Preservation in Diffusion Models for Makeup Transfer

MakeupMirror：在用于化妆迁移的扩散模型中改进面部属性保持

Nefeli Andreou, Angel Martínez-González, Sabine Sternig, Matthieu Guillaumin, Epameinondas Antonakos, Michael Opitz

专题命中图像编辑：扩散模型用于化妆迁移

AI总结提出MakeupMirror扩散模型，通过ControlNet几何条件、区域特定迁移控制、肤色调制和Langevin采样器，在保持面部特征和肤色的同时实现高质量化妆迁移，相比Stable-Makeup提升面部识别相似度60%、降低肤色差异50%。

URL PDF HTML

2606.19961 2026-06-19 cs.CV 新提交专题 85

Addressing Detail Bottlenecks in Latent Diffusion for RGB-to-SWIR Image Translation

解决潜在扩散模型中RGB到SWIR图像翻译的细节瓶颈

Kaili Wang, Martin Dimitrievski, Jose Maria Salvador, Ben Stoffelen, David Van Hamme, Lore Goetschalckx

专题命中图像编辑：改进潜在扩散模型用于RGB到SWIR翻译

AI总结针对潜在扩散模型在RGB到SWIR图像翻译中丢失空间细节的问题，提出源条件自编码器和可学习引导编码器两种轻量级改进，在驾驶场景下将检测mAP提升至2倍，小目标提升3.4倍，并达到最优FID。

URL PDF HTML

2603.07236 2026-06-19 cs.CV 版本更新专题 85

HY-WU (Part I): An Extensible Functional Neural Memory Framework and An Instantiation in Text-Guided Image Editing

HY-WU (第一部分): 一种可扩展的功能性神经记忆框架及其在文本引导图像编辑中的应用

Mengxuan Wu, Xuanlei Zhao, Ziqiao Wang, Ruicheng Feng, Zhangyang Wang, Kai Wang

专题命中图像编辑：提出HY-WU框架用于文本引导图像编辑。

AI总结提出HY-WU框架，通过功能性神经记忆模块即时生成实例特定权重更新，避免共享权重覆盖导致的干扰，解决持续学习与个性化中的灾难性遗忘问题。

URL PDF HTML

2606.20404 2026-06-19 cs.CV 新提交专题 80

FlowBender: Feedback-Aware Training for Self-Correcting Conditional Flows

FlowBender: 面向自校正条件流的反馈感知训练

Daniel Gilo, Sven Elflein, Ido Sobol, Or Litany

专题命中图像编辑：反馈感知训练用于条件流模型，提升图像翻译和修复

AI总结针对条件扩散/流模型常违反任务约束的问题，提出FlowBender闭环框架，将对齐误差作为输入训练网络学习校正策略，在图像翻译、复原和3D纹理贴图中同时提升保真度与合理性。

Comments Project page: https://flow-bender.github.io/

URL PDF HTML

2606.19802 2026-06-19 cs.LG cs.CV 新提交专题 80

Flow Map Denoisers: Traversing the Distortion-Perception Plane for Inverse Problems

流映射去噪器：遍历逆问题的失真-感知平面

Nicolas Zilberstein, Morteza Mardani, Santiago Segarra

专题命中图像编辑：提出流映射去噪器，实现图像恢复中的失真-感知权衡。

AI总结提出流映射模型，通过单一参数t在MMSE和感知质量间连续调节，实现逆问题的失真-感知权衡，无需额外监督或调参。

URL PDF HTML

2606.20233 2026-06-19 cs.CV 新提交专题 70

Cinematic Compositing Using Character-Environment-Harmonized Video Generation Models

使用角色-环境协调视频生成模型的电影级合成

Tianyi Xiang, Mingming He, Li Ma, Jing Liao

专题命中图像编辑：涉及图像合成与光照协调

AI总结提出端到端视频扩散框架，通过三掩码引导和RGB-D联合去噪建模角色与环境的双向物理与光照交互，实现高质量动态视频合成。

URL PDF HTML

2602.01391 2026-06-19 cs.CV 版本更新专题 70

Relighting as a Probe of Visual Priors via Augmented Latent Intrinsics

通过增强潜在本征属性将重光照作为视觉先验的探针

Xiaoyan Xing, Xiao Zhang, Sezer Karaoglu, Theo Gevers, Anand Bhattad

专题命中图像编辑：重光照属于图像编辑范畴

AI总结提出增强潜在本征属性（ALI）方法，融合密集像素对齐视觉特征到潜在本征重光照模型，平衡语义与光度保真度，提升复杂材质重光照质量。

Comments Camera-ready version for ICML 2026. Project page: https://augmented-latent-intrinsics.github.io

URL PDF HTML

2606.20556 2026-06-19 cs.CV 新提交专题 65

Thinking in Boxes: 3D Editing in Real Images Made Easy

Thinking in Boxes: 真实图像中的3D编辑变得简单

Pradhaan S Bhat, Naveen Chandra R, Rishubh Parihar, Vaibhav Vavilala, R. Venkatesh Babu, D. A. Forsyth, Anand Bhattad

专题命中图像编辑：基于3D盒子的图像编辑方法。

AI总结提出使用3D盒子作为结构化规范，通过用户提供输入和输出盒子来精确控制真实图像中的平移、旋转、缩放和视角变化，同时保持场景和物体身份，恢复未见的物体区域。

Comments Project Page: https://thinking-in-boxes.github.io/

URL PDF HTML