2606.01166
2026-06-03
cs.CR
cs.CL
BraveGuard: From Open-World Threats to Safer Computer-Use Agents
BraveGuard: 从开放世界威胁到更安全的计算机使用代理
Yunhao Feng, Xiaohu Du, Xinhao Deng, Yifan Ding, Ming Wen, Yixu Wang, Yuxiang Xie, Baihui Zheng, Yingshui Tan, Yige Li, Yutao Wu, Kerui Cao, Wenke Huang, Yanming Guo, Xingjun Ma, Yu-Gang Jiang
发表机构
*
Fudan University(复旦大学)
;
Ant Group(蚂蚁集团)
;
Hunan Institute of Advanced Technology(湖南高级技术研究所)
;
Alibaba Group(阿里巴巴集团)
;
Singapore Management University(新加坡管理大学)
;
Deakin University(德肯大学)
;
Nanyang Technological University(南洋理工大学)
;
Shanghai Innovation Institute(上海创新研究院)
AI总结
提出BraveGuard框架,通过从开放世界威胁信号和真实代理轨迹中训练防护模型,实现轨迹级别的安全检测,显著提升计算机使用代理的安全性。