Finding the Weakest Link: Adversarial Attack against Multi-Agent Communications
AI总结 本文研究了针对多智能体强化学习系统的对抗攻击问题,重点分析如何通过扰动通信信息来破坏系统性能。作者提出利用雅可比矩阵的梯度信息,识别最易受攻击的消息、智能体及时刻,并设计了两种新的对抗损失函数以平衡攻击成功率与影响程度。实验表明,该方法在多个环境中显著提升了攻击效果,优于随机选择策略。
Comments Full version of the Extended Abstract presented at AAMAS 2026