2605.18329
2026-05-25
cs.CV
cs.LG
版本更新
Lost in the Folds: When Cross-Validation Is Not a Deep Ensemble for Uncertainty Estimation
迷失在折叠中:当交叉验证不是用于不确定性估计的深度集成时
Tristan Kirscher, Markus Bujotzek, Yannick Kirchhoff, Maximilian Rokuss, Fabian Isensee, Kim-Celine Kahl, Balint Kovacs, Klaus Maier-Hein
发表机构
*
ICube Laboratory, CNRS UMR-7357, University of Strasbourg, Strasbourg, France(ICube实验室,法国斯特拉斯堡大学)
;
CLCC Institut-Strauss, Strasbourg, France(CLCC斯特拉斯堡研究所)
;
German Cancer Research Center (DKFZ) Heidelberg, Division of Medical Image Computing(海德堡德国癌症研究中心(DKFZ)医学影像计算部门)
;
Medical Faculty Heidelberg, Heidelberg University, Heidelberg, Germany(海德堡医学院,海德堡大学)
;
Faculty of Mathematics and Computer Science, University of Heidelberg, Germany(海德堡大学数学与计算机科学学院)
;
Helmholtz Imaging, German Cancer Research Center, Heidelberg, Germany(海德堡德国癌症研究中心Helmholtz成像部门)
;
Pattern Analysis and Learning Group, Department of Radiation Oncology, Heidelberg University Hospital, Heidelberg, Germany(海德堡大学医院放射肿瘤学部模式分析与学习小组)
AI总结
在医学图像分割中,集成模型的分歧常被用作认识论不确定性的代理,但许多研究通过K折交叉验证(CV)构建集成模型,却称之为“深度集成”(DE),导致术语与实现不一致。本文对比了标准5折CV集成与5成员DE在三个多标注分割数据集上的表现,发现DE在保持分割精度的同时,提升了校准和失败检测能力,而CV集成有时与标注者间差异相关性更强。研究指出,应根据研究目标选择集成构建方式:DE适用于可靠性导向任务(如选择性转诊),CV集成则更适合作为模糊性代理。