2606.19887
2026-06-19
cs.CR
cs.AI
新提交
专题 90
FFinRED: An Expert-Guided Benchmark Generation and Evaluation Framework for Financial LLM Red-Teaming
FFinRED:面向金融大语言模型红队测试的专家引导基准生成与评估框架
Chaeyun Kim, Daeyoung Park, Junghwan Kim, Jinyoung Jeong, Eunji Song, Yongtaek Lim, Minwoo Kim
专题命中
红队测试
:金融LLM红队测试框架,专家引导。
AI总结
提出FinRED框架,通过专家引导的两级分类法将全球金融标准映射为威胁,并利用真实金融文档生成上下文丰富的红队行为提示,结合专家验证的评估标准,有效降低关键假阴性。