Elmes*: Automated Construction of Fine-Grained Evaluation Rubrics for Large Language Models in Long-Tail Educational Scenarios
Elmes*:面向长尾教育场景的大语言模型细粒度评估量规自动构建
发表机构 * Shanghai Institute of AI for Education, East China Normal University(上海人工智能教育研究院,东华师范大学) ; School of Computer Science and Technology, East China Normal University(计算机科学与技术学院,东华师范大学) ; Shanghai Innovation Institute(上海创新研究院)
AI总结 提出Elmes*框架,自动构建细粒度场景特定量规,用于评估大语言模型在教育场景中的多维教学能力,构建Edu-330基准并揭示模型差异。