2605.10196
2026-05-12
cs.LG
Many Needles in a Haystack: Active Hit Discovery for Perturbation Experiments
Andrea Rubbi, Arpit Merchant, Samuel Ogden, Amir Akbarnejad, Pietro Liò, Sattar Vakili, Mo Lotfollahi
发表机构
*
Wellcome Sanger Institute, Wellcome Genome Campus, Hinxton, UK(韦尔科姆桑格研究所,韦尔科姆基因组校园,英国辛顿)
;
Cambridge Center for AI in Medicine, University of Cambridge, Cambridge, UK(剑桥人工智能医学中心,剑桥大学,剑桥,英国)
;
Cambridge Stem Cell Institute, University of Cambridge, Cambridge, UK(剑桥干细胞研究所,剑桥大学,剑桥,英国)
;
Department of Computer Science and Technology, University of Cambridge, Cambridge, UK(剑桥计算机科学与技术系,剑桥大学,剑桥,英国)
;
MediaTek Research, Cambridge, UK(联发科研究,剑桥,英国)
AI总结
该研究针对高通量基因扰动实验中如何高效发现具有显著表型效应的干预策略这一问题,提出了一种基于概率的主动实验设计方法。核心方法是引入“Probability-of-Hit”获取函数,通过后验概率直接评估候选扰动是否超过预设效应阈值,从而更高效地识别有效干预。该方法在合成数据和真实生物数据上均表现出优越性能,相比基线方法在某些数据集上提升了6.4%的效果。