Probabilistic Verification of Recurrent Neural Networks for Single and Multi-Agent Reinforcement Learning
AI总结 该论文研究了基于循环神经网络(RNN)的策略在部分可观测强化学习中的概率验证问题。针对现有工具在验证RNN策略时依赖严格假设或粗略近似导致结果过于保守的问题,提出了一种名为RNN-ProVe的概率验证框架,通过策略驱动采样估计策略下隐藏状态空间中不良行为的发生概率,并给出统计误差界以提供高置信度的验证结果。实验表明,该方法在单智能体和多智能体任务中能够提供更定量且更具可行性意识的概率保证。
Comments Accepted at the 35th International Joint Conference on Artificial Intelligence (IJCAI) 2026