2606.20470
2026-06-19
cs.CR
cs.AI
新提交
专题 90
Analyzing Defensive Misdirection Against Model-Guided Automated Attacks on Agentic AI Systems
分析针对基于模型引导的自动化攻击的防御性误导策略在智能体AI系统中的应用
Reza Soosahabi, Vivek Namsani
专题命中
越狱攻击
:分析防御性误导策略对抗自动化越狱攻击。
AI总结
本文通过概率模型分析智能体AI系统的攻击-防御场景,提出“检测-误导”策略(如CMPE)以替代传统“检测-拦截”方法,通过产生误导性响应降低攻击者成功率,并在基准测试中将攻击成功率上限降低两个数量级。