2606.02302
2026-06-02
cs.CR
cs.AI
SeClaw: Spec-Driven Security Task Synthesis for Evaluating Autonomous Agents
SeClaw: 面向自主代理评估的规范驱动安全任务合成
Hao Cheng, Changtao Miao, Tianle Song, Yin Wu, He Liu, Erjia Xiao, Junchi Chen, Xiaoyu Shi, Yichi Wang, Jing Yang, Taowen Wang, Jinhao Duan, Mengshu Sun, Peiyan Dong, Xuan Shen, Yang Cao, Renjing Xu, Kaidi Xu, Jindong Gu, Bo Zhang, Jize Zhang, Chenhao Lin, Philip Torr, Chao Shen
发表机构
*
The Hong Kong University of Science and Technology(香港科技大学)
;
Ant Digital Technologies, Ant Group(蚂蚁集团数字技术部)
;
Xi’an Jiaotong University(西安交通大学)
;
The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州))
;
University of Oxford(牛津大学)
;
City University of Hong Kong(香港城市大学)
;
Institute of Science Tokyo(东京科学研究所)
;
Zhejiang University(浙江大学)
;
Massachusetts Institute of Technology(麻省理工学院)
;
University of North Carolina at Chapel Hill(北卡罗来纳大学教堂山分校)
;
Beijing University of Technology(北京理工大学)
AI总结
提出SeClaw框架,通过规范驱动的安全任务合成与基于执行的安全评估,实现对自主LLM代理在状态化环境中的安全风险的可扩展、可复现评估。