Privacy Auditing Synthetic Data Release through Local Likelihood Attacks
AI总结 本文研究了合成数据发布中的隐私泄露问题,提出了一种基于局部似然比的新型无模型成员推理攻击方法——生成似然比攻击(Gen-LRA),该方法无需模型访问或知识,通过评估测试样本对合成数据局部似然比估计的影响来检测训练数据是否被泄露。理论分析表明,Gen-LRA 能在局部过拟合条件下有效区分成员与非成员样本,并在多个数据集和模型架构上表现出优于现有方法的性能,突显了生成模型过拟合对隐私安全的潜在威胁。