2605.16023
2026-05-26
cs.CL
cs.LG
Judge Circuits
Judge Circuits
Nils Feldhus, Tanja Baeumel, Elena Golimblevskaia, Qianli Wang, Van Bach Nguyen, Aaron Louis Eidt, Selin Kahvecioglu, Christopher Ebert, Wojciech Samek, Jing Yang, Vera Schmitt, Sebastian Möller, Simon Ostermann
发表机构
*
Technische Universität Berlin(柏林技术大学)
;
BIFOLD – Berlin Institute for the Foundations of Learning and Data(柏林学习与数据基础研究院)
;
German Research Center for Artificial Intelligence (DFKI)(德国人工智能研究中心)
;
Fraunhofer Heinrich Hertz Institute(弗劳恩霍夫海因里希·赫茨研究所)
;
Marburg University(马尔堡大学)
;
Centre for European Research in Trusted AI (CERTAIN)(欧洲可信人工智能研究中心)
AI总结
本研究利用位置感知边归因修补(PEAP)因果分析Gemma-3、Qwen2.5和Llama-3的内部机制,发现结构化理解和开放式偏好任务中的判断共享一个稀疏、泛化的潜在评估子图,并通过解耦抽象判断与输出格式,揭示了格式诱导不一致性的机制原因。