Remember what you did so you know what to do next
记住你做了什么,以便知道下一步该做什么
发表机构 * Information Sciences Institute, University of Southern California(信息科学研究所,南加州大学)
AI总结 本文研究了使用中等规模的大型语言模型(GPT-J,60亿参数)为模拟机器人在ScienceWorld平台中制定计划,以完成30类科学实验目标。实验表明,通过引入更多历史步骤信息,该模型的性能显著优于基于强化学习的方法,最高可达3.5倍。研究还指出任务类别间的性能差异较大,平均表现可能掩盖具体问题,并展示了在仅使用6.5%训练数据时仍能取得2.2倍的性能提升。
Comments Identical to EMNLP 2023 Findings