Model-Based Quality Assessment for Massively Multilingual Parallel Data
基于模型的大规模多语言平行数据质量评估
发表机构 * University of Jyväskylä(于韦斯屈莱大学) ; University of Helsinki(赫尔辛基大学) ; ELLIS Institute Finland(芬兰ELLIS研究所) ; University of Turku(图尔库大学)
AI总结 针对大规模多语言平行数据中存在的非平行句对和低质量翻译问题,提出将模型评估分解为平行性评估(使用多语言嵌入)和无参考质量估计两个独立组件,并通过实验发现没有模型在所有翻译方向上普遍可靠,建议采用方向感知的路由和校准方法。