医学 AI - arXivDaily 专题

2606.20112 2026-06-19 cs.CV eess.IV 新提交专题 95

Pixel-Level Residual Diffusion Transformer: Scalable 3D CT Volume Generation

像素级残差扩散Transformer：可扩展的3D CT体生成

Zhenkai Zhang, Markus Hiller, Krista A. Ehinger, Tom Drummond

专题命中医学影像：提出3D CT体生成方法，用于医学影像

AI总结提出像素级残差扩散Transformer（PRDiT），通过两阶段训练（局部MLP盲估计器分离低频结构+全局残差扩散Transformer建模高频残差）实现高保真3D CT体生成，在LIDC-IDRI和RAD-ChestCT数据集上优于现有方法。

Comments Accepted at ICLR 2026. Code available at https://github.com/Fredy-Zhang/PRDiT

URL PDF HTML

2606.20108 2026-06-19 cs.CV cs.LG 新提交专题 95

EFIQA: Explainable Fundus Image Quality Assessment via Anatomical Priors

EFIQA: 基于解剖先验的可解释眼底图像质量评估

Pengwei Wang, José Morano, Qian Wan, Hrvoje Bogunović

专题命中医学影像：眼底图像质量评估，医学影像应用

AI总结提出无需质量标签的EFIQA框架，利用解剖先验通过掩膜解剖修复学习正常结构，生成空间质量图，在多个基准上超越监督方法，兼具可解释性。

Comments Accepted in MIDL 2026. Code: https://github.com/penway/EFIQA

Journal ref Proceedings of Machine Learning Research 315:2248-2264, 2026

URL PDF HTML

2606.19838 2026-06-19 cs.CV 新提交专题 95

OTCHA: Optimal Transport-driven Confidence-aware Latent Hub Alignment for Multi-View Medical Image Classification

OTCHA: 基于最优传输的置信度感知潜在中心对齐用于多视图医学图像分类

Jiwoong Yang, Haejun Chung, Ikbeom Jang

专题命中医学影像：多视图医学图像分类，应用于乳腺X光和胸片。

AI总结提出OTCHA模块，通过最优传输对齐多视图补丁令牌与共享潜在中心令牌，结合置信度门控和部分匹配，消除无关特征，提升多视图医学图像分类鲁棒性。

Comments Accepted at MICCAI 2026

URL PDF HTML

2606.19824 2026-06-19 cs.CV cs.AI 新提交专题 95

CSWinUNETR: Segmentation of Thin Anatomical Structures in Medical Images

CSWinUNETR: 医学图像中薄解剖结构的分割

Junho Moon, Haejun Chung, Ikbeom Jang

专题命中医学影像：分割视网膜血管、脑血管等薄解剖结构。

AI总结提出CSWinUNETR通用骨干网络，通过交叉形条带自注意力、循环移位、细节增强多尺度自注意力和稀疏控制动态蛇形卷积，解决薄结构分割中的低对比度、断裂和类不平衡问题，在眼科、神经血管和皮肤科基准上超越现有方法。

Comments Accepted at MICCAI 2026

URL PDF HTML

2606.19460 2026-06-19 cs.CV cs.AI cs.LG 新提交专题 95

Scaling Generative Foundation Models for Chest Radiography with Rectified Flow Transformers

使用整流流变换器扩展胸部X光片的生成式基础模型

Fabio De Sousa Ribeiro, Emma A. M. Stanley, Charles Jones, Tian Xia, Dominic C. Marshall, Laurent Renard Triché, Christopher V. Cosgriff, Panagiotis Dimitrakopoulos, Sotirios A. Tsaftaris, Ben Glocker

专题命中医学影像：十亿参数级胸部X光片生成基础模型。

AI总结提出首个十亿参数级胸部X光片生成基础模型，通过整流流变换器实现高保真可控合成，显著提升合成图像与真实图像的不可区分性。

Comments Project page: https://RadiT-project.github.io

URL PDF HTML

2606.14957 2026-06-19 cs.CV 新提交专题 95

Learning Sparse Latent Predictive Foundation Model for Multimodal Neuroimaging

学习用于多模态神经影像的稀疏潜在预测基础模型

Haoxu Huang, Long Chen, Jingyun Chen, Jinu Hyun, James Ryan Loftus, Kara Melmed, Daniel Orringer, Jennifer Frontera, Seena Dehkharghani, Arjun Masurkar, Narges Razavian

专题命中医学影像：多模态神经影像基础模型

AI总结提出Neuro-JEPA模型，结合潜在预测目标和专家混合架构，学习T1w、T2w和FLAIR三种MRI序列的统一表示，在25项临床任务和22项公开数据集任务上优于现有基础模型和CNN基线。

Comments Under Review Preprint

URL PDF HTML

2605.00665 2026-06-19 cs.CV 版本更新专题 95

Prediction of Alzheimer's Disease Risk Factors from Retinal Images via Deep Learning: Development and Validation of Biologically Relevant Morphological Associations in the UK Biobank

基于深度学习的视网膜图像预测阿尔茨海默病风险因素：英国生物银行中生物学相关形态学关联的开发和验证

Seowung Leem, Yunchao Yang, Adam J. Woods, Ruogu Fang

专题命中医学影像：用深度学习从视网膜图像预测阿尔茨海默病风险因素

AI总结利用深度学习从视网膜彩色眼底照片预测12个阿尔茨海默病相关风险因素，并揭示其背后的视网膜结构特征，发现视神经头和视网膜血管等区域与风险因素及阿尔茨海默病前期变化相关。

Comments Accepted to the "Journal of Alzheimer's Disease" for publication

URL PDF HTML

2601.15119 2026-06-19 eess.IV cs.CV 专题 95

Vision Models for Medical Imaging: A Hybrid Approach for PCOS Detection from Ultrasound Scans

医学影像中的视觉模型：一种用于超声扫描中多囊卵巢综合征检测的混合方法

Md Mahmudul Hoque, Md Mehedi Hassain, Muntakimur Rahaman, Md. Towhidul Islam, Shaista Rani, Md Sharif Mollah

专题命中医学影像：混合视觉模型用于超声图像PCOS检测，属于医学影像分析。

AI总结本文提出两种混合模型，结合卷积和Transformer方法，用于超声图像中多囊卵巢综合征的准确检测，最终模型在准确性上达到98.23%。

URL PDF HTML

2606.19804 2026-06-19 cs.CV 新提交专题 92

HypOProto: Hyperbolic Ordinal Prototypes for Left Ventricular Filling Pressure Classification

HypOProto: 用于左心室充盈压分类的双曲序数原型

Victoria Wu, Nima Hashemi, Hooman Vaseli, Christina Luong, Purang Abolmaesumi, Teresa S. M. Tsang

专题命中医学影像：使用超声心动图进行左心室充盈压分类，属于医学影像分析。

AI总结提出HypOProto框架，利用双曲空间中的序数原型对左心室充盈压进行分类，通过冻结的可解释基础模型实现高精度与临床可解释性。

URL PDF HTML

2606.20477 2026-06-19 cs.CV cs.CL cs.LG 新提交专题 90

Scalable Training of Spatially Grounded 2D Vision-Language Models for Radiology

面向放射学的空间定位2D视觉-语言模型的可扩展训练

Yusuf Salcan, Simon Ging, Robin Schirrmeister, Philipp Arnold, Elmar Kotter, Behzad Bozorgtabar, Thomas Brox

专题命中医学影像：放射学视觉语言模型，空间定位

AI总结提出RefRad2D大规模双语数据集，通过LLM和自动分割生成空间定位数据，训练RadGrounder模型联合完成报告生成、VQA和空间定位，在外部基准上取得竞争性结果。

Comments Accepted for MICCAI 2026. First two authors: equal contribution. Last two authors: equal supervision

URL PDF HTML

2606.20390 2026-06-19 cs.CV 新提交专题 90

Geometry-Aware Superpixel Graph Transformer with Metadata for Skin Lesion Classification

几何感知超像素图变换器结合元数据用于皮肤病变分类

Muhammad Azeem, Tanveer Hussain, Amr Ahmed, Ardhendu Behera

专题命中医学影像：提出基于图的皮肤病变分类方法，使用皮肤镜图像。

AI总结提出一种基于区域的图学习框架，将病变建模为超像素图，利用几何边属性和元数据上下文节点，通过边缘感知图变换器实现多模态融合，在四个公开数据集上取得优于现有方法的分类性能。

Comments Accepted at MICCAI 2026

URL PDF HTML

2606.20172 2026-06-19 cs.LG 新提交专题 90

Predicting gestational age at birth in the context of preterm birth from multi-modal fetal MRI

基于多模态胎儿MRI预测早产背景下的出生胎龄

Diego Fajardo-Rojas, Megan Hall, Daniel Cromb, Mary A. Rutherford, Lisa Story, Emma C. Robinson, Jana Hutter

专题命中医学影像：多模态胎儿MRI预测早产出生胎龄。

AI总结提出结合多模态胎儿MRI和机器学习流程预测出生胎龄，包括数据插补、特征选择和回归模型，在333例对照和93例早产数据上评估，R²=0.13，MAE=2.74周，准确率0.77。

Comments Accepted for publication at the Journal of Machine Learning for Biomedical Imaging (MELBA) https://melba-journal.org/2026:013

Journal ref Machine.Learning.for.Biomedical.Imaging. 2026 (2026)

URL PDF HTML

2606.20161 2026-06-19 cs.CV 新提交专题 90

ARTEMIS: Agent-guided Reliability-aware Temporal Mask Evolution for Imperfectly Supervised Video Polyp Segmentation

ARTEMIS: 基于智能体引导的可靠性感知时间掩码演化用于不完美监督的视频息肉分割

Tong Wang, Siwen Wang, Yaolei Qi, Jinxing Zhou, Yuting He, Guanyu Yang, Yutong Xie

专题命中医学影像：视频息肉分割，临床医学影像应用。

AI总结提出ARTEMIS框架，利用视觉语言智能体选择可靠时间锚点，结合SAM2传播和可靠性感知鲁棒学习，从不完美监督（点、涂鸦、少量密集标签）中学习高质量视频息肉分割掩码，在多个基准上达到最优性能。

URL PDF HTML

2606.20143 2026-06-19 cs.CV 新提交专题 90

HEad and neCK TumOR (HECKTOR) 2025: Benchmark of Segmentation, Diagnosis, and Prognosis in Multimodal PET/CT

头颈肿瘤 (HECKTOR) 2025 挑战赛：多模态 PET/CT 中的分割、诊断与预后基准

Numan Saeed, Salma Hassan, Shahad Hardan, Lishan Cai, Xinglong Liang, Moona Mazher, Abdul Qayyum, Yansong Bu, Mengye Lyu, Yue Lin, Mingyuan Meng, Chuanyi Huang, Lisheng Wang, Dalal Chamseddine, Shamimeh Ahrari, Beining Wu, Yifei Chen, Fuyou Mao, Hao Zhang, Baixiang Zhao, Surajit Ray, Muzi Guo, Lei Xiang, Jakob Dexl, Michael Ingrisch, Adrien Depeursinge, Arman Rahmim, Mathieu Hatt, Vincent Andrearczyk, Mohammad Yaqub

专题命中医学影像：头颈肿瘤PET/CT分割、诊断与预后基准。

AI总结 HECKTOR 2025 挑战赛利用多模态 PET/CT 和电子健康记录，建立了头颈癌自动分析的基准，涵盖肿瘤分割、复发预测和 HPV 分类三个任务，最佳算法分别达到 Dice 0.75、C-index 0.66 和平衡准确率 0.56。

Comments 17 pages, 4 figures, 4 tables. Overview paper for the HECKTOR 2025 challenge, held as a satellite event at MICCAI 2025. Challenge website: https://hecktor.grand-challenge.org/

URL PDF HTML

2606.20037 2026-06-19 cs.LG 新提交专题 90

Alzheimer's Disease Diagnosis using a Multimodal Approach with 3D MRI and PET

使用3D MRI和PET的多模态方法诊断阿尔茨海默病

Loukas Ilias, Anthi-Maria Vozinaki, Christos Ntanos, Dimitris Askounis

专题命中医学影像：用MRI和PET多模态诊断阿尔茨海默病。

AI总结提出结合3D卷积特征提取器与三种融合策略（拼接、门控多模态单元、门控自注意力）及稀疏门控混合专家分类器的多模态模型，用于阿尔茨海默病诊断，在三个二分类任务上验证了输入自适应建模的有效性。

Comments 2025 IEEE International Conference on Bioinformatics and Biomedicine (BIBM)

URL PDF HTML

2606.19651 2026-06-19 cs.AI cs.CV cs.LG 新提交专题 90

BrainG3N: A Dual-Purpose Tokenizer for Controllable 3D Brain MRI Generation

BrainG3N：用于可控3D脑MRI生成的双用途分词器

Max Van Puyvelde, Ibrahim Gulluk, Wim Van Criekinge, Olivier Gevaert

专题命中医学影像：基于3D掩码自编码器的脑MRI生成，支持条件生成

AI总结提出基于3D掩码自编码器的分词器，解耦编码器与解码器，在23项线性探测任务中21项超越SOTA，并支持条件生成和纵向预测。

URL PDF HTML

2606.19371 2026-06-19 cs.LG cs.AI cs.CV 新提交专题 90

ProMUSE: Progressive Multi-modal Uncertainty-guided Staged Evidential Alzheimer Disease Classification

ProMUSE: 渐进式多模态不确定性引导的分阶段证据阿尔茨海默病分类

Long Doan, Branden Chen, Ethan Litton, Huan Huang, Jiajing Huang, Yixin Xie, Weihua Zhou, Nandakumar Narayanan, Chen Zhao

专题命中医学影像：多模态阿尔茨海默病分类，使用MRI和PET。

AI总结提出ProMUSE，一种渐进式多模态不确定性引导的分阶段证据网络，通过自适应决定何时需要额外模态，在保持准确性的同时降低数据采集成本。

URL PDF HTML

2508.01819 2026-06-19 eess.IV 版本更新专题 90

Decoding the Alzheimer's Continuum: Interpretable Multi-Gate Routing for Diagnosis and Transition Prediction

解码阿尔茨海默病连续谱：可解释的多门路由用于诊断与转换预测

Yufeng Jiang, Hexiao Ding, Hongzhao Chen, Jing Lan, Xinzhi Teng, Gerald W. Y. Cheng, Yunlin Mao, Zongxi Li, Haoran Xie, Jung Sun Yoo, Jing Cai

专题命中医学影像：基于sMRI进行阿尔茨海默病诊断和转换预测。

AI总结提出M$^3$AD统一框架，利用可解释多门专家混合架构，基于T1加权sMRI同时实现三分类诊断和阶段转换预测，准确率达95.13%。

Comments Accepted by MICCAI2026

URL PDF HTML

2507.23027 2026-06-19 cs.CV cs.AI 专题 90

Recovering Diagnostic Value: Super-Resolution-Aided Echocardiographic Classification in Resource-Constrained Imaging

恢复诊断价值：超分辨率辅助的资源受限成像中的心电图分类

Krishan Agyakari Raja Babu, Om Prabhu, Annu, Mohanasankar Sivaprakasam

专题命中医学影像：超分辨率增强超声心动图分类，属于医学影像。

AI总结本文研究了基于深度学习的超分辨率技术在低质量2D超声心动图分类中的应用，通过CAMUS数据集验证了SRGAN和SRResNet在提升分类准确率和计算效率方面的有效性。

Comments Accepted at the MICCAI Workshop on "Medical Image Computing in Resource Constrained Settings & Knowledge Interchange (MIRASOL)" 2025

URL PDF HTML

2503.23179 2026-06-19 eess.IV cs.CV 版本更新专题 90

OncoReg: Medical Image Registration for Oncological Challenges

OncoReg：面向肿瘤学挑战的医学图像配准

Wiebke Heyer, Yannic Elser, Lennart Berkel, Xinrui Song, Xuanang Xu, Pingkun Yan, Xi Jia, Jinming Duan, Zi Li, Tony C. W. Mok, BoWen LI, Tim Hable, Christian Staackmann, Christoph Großbröhmer, Lasse Hansen, Alessa Hering, Malte M. Sieren, Mattias P. Heinrich

专题命中医学影像：医学图像配准用于肿瘤放疗，属于医学影像。

AI总结提出OncoReg挑战，通过两阶段框架在保护患者隐私的同时开发可泛化的图像配准方法，用于放射治疗中锥束CT与扇束CT的配准，发现特征提取是关键，深度学习和经典方法结合最有效。

Comments 21 pages, 13 figures

URL PDF HTML

2504.02885 2026-06-19 cs.CL 版本更新专题 90

Med-R2: Perception and Reflection-driven Complex Reasoning for Medical Report Generation

Med-R2：面向医学报告生成的感知与反思驱动复杂推理

Hao Wang, Shuchang Ye, Jinghao Lin, Usman Naseem, Jinman Kim

专题命中医学影像：提出医学报告生成方法，涉及病理特征感知和诊断推理

AI总结提出Med-R2微调策略，通过引入感知驱动的长推理过程和放射学知识指导，并加入反思机制修正感知错误，提升LVLMs在医学报告生成中的病理特征感知和诊断准确性。

Comments 28 pages, 3 figures, 1 table

URL PDF HTML

2405.10705 2026-06-19 eess.IV cs.CV 版本更新专题 90

3D Vessel Reconstruction from Sparse-View Dynamic DSA Images via Vessel Probability Guided Attenuation Learning

基于血管概率引导衰减学习的稀疏视角动态DSA图像三维血管重建

Zhentao Liu, Huangxuan Zhao, Wenhui Qin, Zhenghong Zhou, Xinggang Wang, Wenping Wang, Xiaochun Lai, Chuansheng Zheng, Dinggang Shen, Zhiming Cui

专题命中医学影像：提出稀疏视角DSA重建方法，降低辐射剂量

AI总结提出血管概率引导衰减学习框架，通过静态与动态衰减场互补加权实现稀疏视角DSA重建，降低辐射剂量，并采用渐进训练和时间扰动损失提升质量。

Comments Accepted by Medical Image Analysis (MedIA), 2026

URL PDF HTML

2606.20449 2026-06-19 cs.CV 新提交专题 85

InfantFace: Detecting infant faces in neonatal clinical environments

InfantFace：新生儿临床环境中的婴儿面部检测

Abdullah Bin-Obaid, Maria M. Cobo, Rebeccah Slater, Lionel Tarassenko, Mauricio Villarroel

专题命中医学影像：应用于新生儿临床环境，辅助医疗评估

AI总结针对新生儿临床环境中的遮挡和光照问题，提出基于YOLOv11m的单阶段面部检测模型，在多个公开数据集预训练后，通过临床数据微调，AP50从0.87提升至0.96。

Comments 32 pages, 7 figures, 4 tables; supplementary information included

URL PDF HTML

2606.20303 2026-06-19 cs.CV 新提交专题 85

GEN-Guard: Correcting Generalization Failures for Deployable Federated Surgical AI

GEN-Guard：纠正可部署联邦手术AI的泛化失败

Julia Alekseenko, Pietro Mascagni, AI4SafeChole Consortium, Nicolas Padoy

专题命中医学影像：联邦手术AI泛化失败检测与纠正

AI总结提出GEN-Guard框架，通过客户端阻塞评估检测性能泄漏，并利用分歧感知蒸馏进行特征级校正，提升联邦手术AI的跨机构泛化能力。

Journal ref Int J Comput Assist Radiol Surg. 2026 Jun 14

URL PDF HTML

2606.20115 2026-06-19 cs.LG cs.CV 新提交专题 85

When Calibration Fails the Vulnerable Hospital: Federated Conformal Risk Control via Risk-Curve Shrinkage

当校准失败于脆弱的医院：通过风险曲线收缩实现联邦共形风险控制

Nafis Fuad Shahid

专题命中医学影像：联邦共形风险控制用于脑肿瘤分割。

AI总结针对联邦部署中标准共形风险控制（CRC）对个体机构覆盖不足的问题，提出基于风险曲线收缩的联邦CRC协议，在真实脑肿瘤数据上实现2.7/20的违规率且预测集仅扩大2.0倍。

Comments 9 pages, 3 figures, 2 tables. Submitted to the DeCaF Workshop at MICCAI 2026

URL PDF HTML

2606.20035 2026-06-19 cs.CV cs.LG 新提交专题 85

PU-UNet: Stable Multiplicative Interactions for Medical Image Segmentation

PU-UNet：用于医学图像分割的稳定乘法交互

Ziyuan Li, Osamah Sufyan, Uwe Jaekel, Babette Dellen

专题命中医学影像：提出PU-UNet用于医学图像分割。

AI总结提出PU-UNet，通过稳定乘积单元残差块在低分辨率阶段实现显式乘法特征交互，在三个医学图像分割数据集上提升Dice和IoU，降低假阳性率。

Comments Accepted to the ICANN 2026

URL PDF HTML

2606.20027 2026-06-19 cs.CV 新提交专题 85

QG-MIL: A Gated Transformer Aggregator for Domain-Agnostic Multiple Instance Learning in Medical Imaging

QG-MIL：一种用于医学影像中领域无关多实例学习的门控Transformer聚合器

Luca Zedda, Davide Antonio Mura, Cecilia Di Ruberto, Maurizio Atzori, Muhammed Furkan Dasdelen, Carsten Marr, Andrea Loddo

专题命中医学影像：提出多实例学习聚合器用于医学影像分析。

AI总结提出QG-MIL门控Transformer聚合器，通过RMSNorm预归一化、逐头QK归一化、细粒度注意力输出门控和SwiGLU前馈模块，解决注意力集中问题，在六个基准上平均提升+6.1个宏F1分数。

URL PDF HTML

2606.19908 2026-06-19 cs.CV 新提交专题 85

Gaussian Process Prior Variational Autoencoder for Endoscopic Videos

用于内窥镜视频的高斯过程先验变分自编码器

Ivan De Boi, Xinxing Shi, Xiaoyu Jiang, Tim J. M. Jaspers, Francisco Caetano, Mauricio A. Alvarez, Fons van der Sommen, Sam Van der Jeught

专题命中医学影像：针对内窥镜视频缺失帧插值与修复。

AI总结提出高斯过程先验变分自编码器（GPVAE），通过时间高斯过程先验替代因子化先验，结合两种可扩展GP近似和镜面反射掩码，实现内窥镜视频缺失帧的插值与修复，在C3VDv2数据集上平均降低RMSE 21.9%。

URL PDF HTML

2606.19889 2026-06-19 cs.CV 新提交专题 85

SurgVista: Long-Horizon Surgical World Modeling with Plausible Instrument-Tissue Dynamics

SurgVista：具有合理器械-组织动力学的长程手术世界建模

Wentao Pan, Wuyang Li, Shengyuan Liu, Xinyu Liu, Hengyu Liu, Yixuan Yuan

专题命中医学影像：手术世界模型，用于机器人手术策略学习。

AI总结提出SurgVista手术世界模型，通过变形一致性正则化和漂移适应训练，解决空间交互不连贯和时间保真度崩溃问题，在长程预测中显著优于现有方法。

URL PDF HTML

2606.19867 2026-06-19 cs.CV cs.AI 新提交专题 85

PSCT-Net: Geometry-Aware Pediatric Skull CT Reconstruction via Differentiable Back-Projection and Attention-Guided Refinement

PSCT-Net: 通过可微反投影和注意力引导细化实现几何感知的儿科颅骨CT重建

Dong Yeong Kim, Jaewon Choi, Youmin Shin, Jungyu Lee, Myeongseop Kim, Jinwook Choi, Joo Whan Kim, Young-Gon Kim

专题命中医学影像：儿科颅骨CT重建，低剂量替代方案。

AI总结提出PSCT-Net，利用可微反投影建立空间先验，结合注意力引导投影和双向Mamba模块，从稀疏双平面X射线重建3D CT，缓解深度模糊并改善骨边界。

Comments 11pages, 5 figures

URL PDF HTML