Measuring Agents in Production
生产环境中的智能体测量
发表机构 * University of California at Berkeley(加州大学伯克利分校) ; IBM Research(IBM研究院) ; University of Illinois at Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Stanford University(斯坦福大学)
AI总结 通过对86个已部署系统的调查和20个案例研究,发现生产环境中的LLM智能体主要采用简单可控的方法,可靠性是首要挑战,并依赖系统级设计和人工评估。
Comments Accepted to the 43rd International Conference on Machine Learning (ICML 2026) as Oral Presentation