AI 大模型
AI Agent
智能体、工具调用、规划、工作流、多智能体和自主任务执行。
VitalAgent: A Tool-Augmented Agent for Reactive and Proactive Physiological Monitoring over Wearable Health Data
VitalAgent: 一种工具增强型代理,用于对可穿戴健康数据进行反应性和主动式生理监测
专题命中 工具调用 :工具增强推理和主动监测的智能体框架
AI总结 提出VitalAgent框架,通过工具增强推理和纵向生理记忆,实现对ECG/PPG信号的反应性问答与主动监测,在VitalBench基准上相比基线提升超30%。
Comments Minor revisions; results unchanged
S-Agent: Spatial Tool-Use Elicits Reasoning for Spatial Intelligence
S-Agent:空间工具使用激发空间智能推理
专题命中 工具调用 :提出空间工具使用智能体范式,层次化工具集
AI总结 提出S-Agent空间工具使用智能体范式,通过时空证据积累和层次化工具集,将VLM作为语义规划器,实现连续多视图图像和视频的空间推理,在无训练下提升开源和闭源VLM性能,并基于S-300K轨迹微调得到紧凑空间智能体S-Agent-8B。
Comments Project Page : https://Ropedia.github.io/S-Agent
When Lower Privileges Suffice: Investigating Over-Privileged Tool Selection in LLM Agents
当较低权限足够时:探究LLM代理中的过度权限工具选择
专题命中 工具调用 :聚焦LLM代理工具选择中的权限问题。
AI总结 针对LLM代理在工具选择中偏好高权限工具的安全问题,提出ToolPrivBench评估框架,发现主流代理普遍存在过度权限选择且被瞬态故障放大,并设计权限感知后训练防御方法有效减少不必要的高权限工具使用。
Comments code: https://github.com/AISafetyHub/agent-tool-selection-bias
Benchmarking LLM Agents on Meta-Analysis Articles from Nature Portfolio
对Nature Portfolio元分析文章进行LLM代理基准测试
专题命中 工具调用 :评估LLM代理在元分析检索筛选中的表现
AI总结 提出MetaSyn数据集,包含442篇专家策划的元分析,用于评估LLM代理在检索-筛选-综合全流程中的表现,发现当前系统在筛选阶段存在严重瓶颈。
Comments 13 pages, 7 figures, preprint for arXiv, dataset and code available at https://github.com/BFTree/MetaSyn