2605.23201
2026-05-25
cs.SD
cs.MM
版本更新
MixFake: Benchmarking and Enhancing Audio Deepfake Detection in Diverse Real-world Mixed Audio
MixFake: 在多样真实混合音频中基准测试和增强音频深度伪造检测
Qingcao Li, Yipeng Lin, Weichen Lian, Zhongjie Ba, Peng Cheng, Zhichao Lian
发表机构
*
School of Cyber Science and Engineering, Nanjing University of Science and Technology, Nanjing, China(南京理工大学信息科学与工程学院)
;
The State Key Laboratory of Blockchain and Data Security, Zhejiang University, Hangzhou, China(浙江大学区块链与数据安全国家重点实验室)
;
Hangzhou High-Tech Zone (Binjiang) Institute of Blockchain and Data Security, Hangzhou, China(杭州高新技术区(滨江)区块链与数据安全研究院)
AI总结
本文提出MixFake,一个用于评估和提升音频深度伪造检测性能的大型基准数据集,旨在模拟真实世界中包含背景音乐或噪声的复杂语音环境。为解决现有基于自监督学习的方法在处理非语音或混合源音频时的不足,作者提出了一种多流提示调优框架,通过注入信号级先验信息增强SSL模型对音频伪影的捕捉能力。实验表明,该方法在前景检测和复杂背景检测任务中均显著优于现有方法,取得了优异的检测性能。