FORT-Searcher: Synthesizing Shortcut-Resistant Search Tasks for Training Deep Search Agents
FORT-Searcher:合成抗捷径搜索任务以训练深度搜索智能体
发表机构 * Gaoling School of Artificial Intelligence Renmin University of China(中国人民大学高瓴人工智能学院) ; KAUST(阿卜杜拉国王科技大学) ; IQuest Research(IQuest研究院) ; Shanghai Jiao Tong University(上海交通大学)
AI总结 提出FORT框架,通过控制四种捷径风险合成抗捷径训练数据,使搜索智能体进行更长的预答案搜索,减少捷径模式,仅用SFT训练即达到最优性能。