NIM4-ASR: Towards Efficient, Robust, and Customizable Real-Time LLM-Based ASR
NIM4-ASR:迈向高效、鲁棒且可定制的实时基于LLM的语音识别
发表机构 * Advanced Intelligent Systems Group, NIO(蔚来智能系统集团)
AI总结 提出NIM4-ASR框架,通过重新设计多阶段训练范式(包括预训练架构优化、迭代异步SFT和ASR专用强化学习)以及生产优化(噪声鲁棒性、流式推理和RAG热词定制),在2.3B参数下实现SOTA性能。