Analyzing Error Propagation in Korean Spoken QA with ASR-LLM Cascades
分析韩语语音问答中ASR-LLM级联中的误差传播
发表机构 * Korea Culture Technology Institute, Republic of Korea(韩国文化科技研究所) ; Maum AI Inc., Republic of Korea(马姆人工智能公司)
专题命中 领域大模型 :研究ASR-LLM级联在韩语语音问答中的误差传播
AI总结 本文研究了韩语语音问答中ASR-LLM级联中误差传播的问题,通过分析下游语义失败,揭示了传统ASR指标无法完全捕捉的误差影响,发现不同性能的LLM在级联降级上的一致性,识别出单字符ASR错误作为语义失败通道,并通过辅助比较表明大音频语言模型在噪声韩语SQA中优于匹配语言模型的ASR-LLM流水线。
Comments Preprint. Submitted to APSIPA ASC 2026