IndicMedDialog: A Parallel Multi-Turn Medical Dialogue Dataset for Accessible Healthcare in Indic Languages
AI总结 本文介绍了IndicMedDialog,一个包含英印九种语言的平行多轮医疗对话数据集,旨在提升医疗对话系统在印地语系语言中的适用性和对话真实性。该数据集通过大语言模型生成对话并经母语者验证和后处理优化,同时基于该数据集微调了参数高效的医疗语言模型IndicMedLM,以实现更个性化的症状收集。研究通过多语言基线对比和专家评估,验证了模型的临床合理性和有效性。
Comments Accepted in BioNLP @ ACL 2026 Conference