Improving Code-Switching ASR with Code-Mixing Guided Synthetic Speech
利用语码混合引导的合成语音改进语码转换语音识别
发表机构 * College of Computing and Data Science, Nanyang Technological University(南洋理工大学计算与数据科学学院) ; Google DeepMind(谷歌深度思维)
AI总结 针对语码转换语音识别中高质量文本-语音对稀缺的问题,提出语码混合引导的偏好学习框架,通过语码混合指数优化合成语音的转换保真度,在SEAME语料库上微调Whisper Large,将混合错误率从12.1%/17.8%降至8.9%/14.2%。
Comments Accepted to Interspeech 2026