S-Agent: Spatial Tool-Use Elicits Reasoning for Spatial Intelligence
S-Agent:空间工具使用激发空间智能推理
专题命中 视觉推理 :利用VLM作为语义规划器进行空间推理
AI总结 提出S-Agent空间工具使用智能体范式,通过时空证据积累和层次化工具集,将VLM作为语义规划器,实现连续多视图图像和视频的空间推理,在无训练下提升开源和闭源VLM性能,并基于S-300K轨迹微调得到紧凑空间智能体S-Agent-8B。
Comments Project Page : https://Ropedia.github.io/S-Agent