图像生成 - arXivDaily 专题

2606.19718 2026-06-19 cs.CV 新提交专题 90

One-Shot Novel View and Pose Human Image Synthesis via 3D Prior Guided Diffusion Model

基于3D先验引导扩散模型的单样本新视角与姿态人体图像合成

Shenjian Gong, Kangkan Wang, Shanshan Zhang, Jian Yang

专题命中可控生成：基于扩散模型合成新视角和姿态的人体图像。

AI总结提出一种基于条件去噪扩散模型的方法，利用3D人体先验（法线图和颜色提示）作为几何和颜色条件，从单张参考图像合成任意姿态和视角的高质量人体图像，包括被遮挡部分。

Comments 30 pages, 10 figures

URL PDF HTML

2606.20110 2026-06-19 cs.CV 新提交专题 80

FrozenDrive: Zero-Shot Text-Guided Driving Scene Generation and Data Augmentation with Parameter-Free Frozen Diffusion Model

FrozenDrive: 零样本文本引导驾驶场景生成与数据增强的无参数冻结扩散模型

Yuhwan Jeong, Hyeonseong Kim, Daehyun We, Seonkyu Song, Jinnyeong Yang, Hyun-Kurl Jang, Youngho Yoon, Kuk-Jin Yoon

专题命中可控生成：文本引导的驾驶场景生成

AI总结提出FrozenDrive框架，利用冻结的预训练扩散模型，通过知识保留的时空注意力实现多视图一致性和时间连贯性，无需微调即可生成恶劣天气下的驾驶场景，提升自动驾驶模型鲁棒性。

Comments Accepted to ECCV 2026

URL PDF HTML

2606.20083 2026-06-19 cs.CV 新提交专题 80

Holo-World: Unified Camera, Object and Weather Control for Video World Model

Holo-World: 视频世界模型的统一相机、物体和天气控制

Xiangchen Yin, Wenzhang Sun, Jiahui Yuan, Zijie Liu, Yinda Chen, Wei Li, Dachun Kai, Chunfeng Wang, Xiaoyan Sun

专题命中可控生成：相机、物体、天气联合控制

AI总结提出Holo-World，一种从单张图像联合控制相机、物体运动和天气的统一视频世界模型，通过场景适配器和解耦CFG实现世界保持与天气迁移。

Comments Project Page: \url{https://xiangchenyin.github.io/Holo-World} Code: \url{https://github.com/XiangchenYin/Holo-World}

URL PDF HTML

2606.19736 2026-06-19 cs.CV 新提交专题 80

VFACamou: View-Fused Adversarial Camouflage for Environment-Adaptive Physical Evasion

VFACamou: 视图融合的对抗性伪装用于环境自适应物理规避

Shihui Yan, Hu Liu, Junyu Shi, Zihui Zhu, Ziqi Zhou, Yufei Song, Youming Geng, Minghui Li, Shengshan Hu

专题命中可控生成：使用扩散纹理生成器生成对抗图案。

AI总结提出一种端到端框架，结合UV体积渲染与扩散纹理生成器，并引入照明颜色一致性估计器和多尺度动态训练策略，生成可穿戴对抗图案，在无人机侦察等动态视角和光照变化下实现稳定物理攻击。

Comments Accepted by ICME 2026

URL PDF HTML

2601.12870 2026-06-19 cs.CE 版本更新专题 75

Text2Structure3D: Graph-Based Generative Modeling of Equilibrium Structures with Diffusion Transformers

Text2Structure3D: 基于扩散变换器的图生成建模平衡结构

Lazlo Bleker, Zifeng Guo, Kaleb E. Smith, Kam-Ming Mark Tam, Karla Saldaña Ochoa, Pierluigi D'Acunto

专题命中可控生成：从文本生成平衡结构图，属于可控结构生成。

AI总结提出Text2Structure3D，结合潜在扩散、变分图自编码器和图变换器，从自然语言提示生成接近平衡状态的结构图，并通过残余力优化确保完全满足静力平衡。

Journal ref Results in Engineering 31 (2026) 111375

URL PDF HTML

2606.15015 2026-06-19 cs.CV cs.AI 新提交专题 70

NEXUS: Neural Energy Fields for Physically Consistent Contact-Rich 3D Object Dynamics

NEXUS: 用于物理一致的高接触3D物体动力学的神经能量场

Qizhen Ying, Guangming Wang, Yangchen Pan, Victor Adrian Prisacariu, Brian Sheil, Yixiong Jing

专题命中可控生成：指导物理一致视频生成

AI总结提出神经能量场框架NEXUS，通过标量能量和耗散项建模保守与非保守动力学，提升高接触3D场景下的长时程轨迹精度并指导视频生成。

Comments 18 pages, 4 figures, 6 tables. Preprint

URL PDF HTML

2601.21081 2026-06-19 cs.CV 版本更新专题 70

Shape of Thought: Progressive Object Assembly via Visual Chain-of-Thought

思维形状：通过视觉思维链进行渐进式物体组装

Yu Huo, Siyu Zhang, Kun Zeng, Haoyue Liu, Owen Lee, Junlin Chen, Yuquan Lu, Yifu Guo, Yaodong Liang, Xiaoying Tang

专题命中可控生成：文本到图像生成中的组合结构约束

AI总结提出Shape-of-Thought (SoT)框架，通过视觉思维链在渲染2D域中逐步组装形状，解决文本到图像生成中的组合结构约束问题，在组件计数和结构拓扑上显著优于直接生成。

Comments ICML2026

URL PDF HTML

2503.01425 2026-06-19 cs.GR cs.CV 版本更新专题 70

MeshPad: Interactive Sketch-Conditioned Artist-Reminiscent Mesh Generation and Editing

MeshPad: 交互式草图条件艺术家风格网格生成与编辑

Haoxuan Li, Ziya Erkoc, Lei Li, Daniele Sirigatti, Vladislav Rosov, Angela Dai, Matthias Nießner

专题命中可控生成：草图条件生成3D网格，涉及可控生成。

AI总结提出MeshPad，一种基于草图输入的交互式3D网格生成与编辑方法，通过分解为网格区域的删除和添加操作，结合Transformer和顶点对齐推测策略，实现快速迭代编辑，在Chamfer距离上提升22%以上质量，并获90%用户偏好。

Comments Project page: https://derkleineli.github.io/meshpad/ Video: https://www.youtube.com/watch?v=_T6UTGTMZ1E

URL PDF HTML