2605.24635
2026-05-26
cs.CL
HiMed: Incentivizing Hindi Reasoning in Medical LLMs
HiMed: 激励医疗大语言模型中的印地语推理
Dingfeng Jiang, Han Yan, Chenze Ma, Amit Kumar Jaiswal, Ang Li, Yunxiang Jiang, Xinlei Xiong, Juhao Liang, Hongru Xiao, Xiang Li, Fan Bu, Jiale Han, Ruchir Gupta, Prayag Tiwari, Benyou Wang
发表机构
*
The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳))
;
Indian Institute of Technology (Banaras Hindu University) Varanasi(印度理工学院(班加罗尔 Hindu 大学)瓦拉纳西分校)
;
Tongji University(同济大学)
;
Shenzhen Research Institute of Big Data(深圳大数据研究院)
;
Shenzhen Loop Area Institute(深圳科创园区研究院)
;
The Hong Kong University of Science and Technology(香港科技大学)
;
Halmstad University(哈尔姆斯塔德大学)
AI总结
针对医疗大语言模型在印地语上表现不佳的问题,提出HiMed印地语医疗推理语料库与基准,并通过衰减支架奖励训练HiMed-8B模型,显著提升印地语医疗推理性能并缩小英印准确率差距。