图像生成 - arXivDaily 专题

2606.20536 2026-06-19 cs.CV 新提交专题 75

The FID Lottery: Quantifying Hidden Randomness in Generative-Model Evaluation

FID 彩票：量化生成模型评估中的隐藏随机性

Nicolas Dufour, Alexei A. Efros, Patrick Pérez

专题命中其他图像生成：研究FID评估中的随机性，影响生成模型评测

AI总结研究FID作为随机变量在训练和生成种子上的方差，发现重训练比重采样导致更大FID波动，提出新评估协议：使用每类最优引导、报告多个训练种子的误差条。

Comments Website: https://kyutai.org/fid-lottery

URL PDF HTML

2606.20488 2026-06-19 cs.CV 新提交专题 75

How Fragile Are Training-Free AI-Generated Image Detectors? A Controlled Audit of Score Direction, Preprocessing, and Compression

无训练AI生成图像检测器有多脆弱？对分数方向、预处理和压缩的受控审计

Jingwen Zhou, Mingzhe Wang

专题命中其他图像生成：检测AI生成图像，评估生成质量

AI总结本文通过统一协议审计两种无训练检测分数（自编码重建和噪声扰动特征相似性）及kNN基线，发现实现细节、分数方向选择和数据集格式偏差会导致AUROC变化高达0.38，且简单融合无法超越最佳单分数。

URL PDF HTML

2606.20563 2026-06-19 cs.CV 新提交专题 70

JanusMesh: Fast and Zero-Shot 3D Visual Illusion Generation via Cross-Space Denoising

JanusMesh: 通过跨空间去噪实现快速零样本3D视觉错觉生成

Siang-Ling Zhang, Huai-Hsun Cheng, Tsung-Ju Yang, Yu-Lun Liu

专题命中其他图像生成：生成双语义3D视觉错觉，属于图像生成

AI总结提出一种无需训练的快速框架，通过跨空间双分支去噪和视图条件纹理合成，在3-5分钟内生成高真实感双语义3D视觉错觉，优于现有方法。

Comments ECCV 2026. Project page: https://siang1105.github.io/JanusMesh.github.io/

URL PDF HTML

2606.16417 2026-06-19 cs.SD eess.AS 新提交专题 70

Joycent: Diffusion-based Accent TTS without Accented Phone Prediction

Joycent: 基于扩散的口音语音合成，无需口音音素预测

Xintong Wang, Ye Wang

专题命中其他图像生成：扩散模型用于口音语音合成

AI总结提出Joycent，一种基于扩散模型的口音TTS方法，直接从标准音素序列和语音参考合成口音语音，无需口音音素预测，通过条件层归一化集成口音和说话人表征，并引入WhisAID口音识别模型，在保持说话人身份的同时提升口音自然度。

URL PDF HTML

2606.19957 2026-06-19 cs.CY 新提交专题 60

Modest, artistic, and radical solutions to the environmental impact of image-generating machine learning

图像生成机器学习的环境影响：温和、艺术与激进的解决方案

Laura U. Marks, Jess MacCormack, Kehui Li

专题命中其他图像生成：讨论图像生成ML的环境影响与解决方案

AI总结针对图像生成ML的高能耗问题，从计算机工程、媒体研究和艺术角度探索非精确计算、小模型、低精度硬件等解决方案，并提出真实成本核算。

Comments Paper in Proceedings of LIMITS 2026: 12th Workshop on Computing within Limits, 2026-06-23-25, Online

URL PDF HTML

2507.04081 2026-06-19 cs.NI 版本更新专题 60

Graph Diffusion-Based AeBS Deployment and Resource Allocation in RSMA-Enabled URLLC Low-Altitude Wireless Networks

基于图扩散的RSMA使能URLLC低空无线网络中AeBS部署与资源分配

Xudong Wang, Lei Feng, Jiacheng Wang, Hongyang Du, Changyuan Zhao, Wenjing Li, Ping Zhang

专题命中其他图像生成：图扩散模型用于资源分配，弱相关。

AI总结针对低空无线网络中频谱受限和同频干扰问题，提出基于速率分割多址接入（RSMA）的传输设计，并利用生成式图扩散模型联合优化AeBS部署、用户关联和资源分配，以最大化总速率和覆盖率。

Comments 13 pages, 9 figures

URL PDF HTML

2606.19701 2026-06-19 astro-ph.HE 新提交专题 55

On the Contribution of Local Sources to the Galactic Cosmic-Ray Spectrum: An Exact Series Solution for Two-Zone Diffusion

论局部源对银河宇宙射线谱的贡献：两区扩散的精确级数解

Zi-Hang Liu, Yiwei Bao, Ruo-Yu Liu

专题命中其他图像生成：局部源对宇宙射线谱贡献的扩散模型

AI总结本文推导了两区扩散模型的级数格林函数，通过蒙特卡洛模拟发现近源慢扩散使局部源贡献概率从0.4%升至1.7-2.2%，但统计困难仍存，且局部源解释高度依赖模型。

Comments submitted to PRD, The code accompanying this paper will be released soon

URL PDF HTML