Active Evidence-Seeking and Diagnostic Reasoning in Large Language Models for Clinical Decision Support
大语言模型在临床决策支持中的主动证据获取与诊断推理
AI总结 研究探讨了大语言模型在临床决策支持中的主动证据获取与诊断推理问题,提出了一种基于OSCE的标准化患者模拟器和可控可复现的基准测试,发现多轮证据获取会降低诊断准确性并降低支持证据质量,表明静态全上下文基准可能高估交互证据获取场景中的性能,需引入互补的交互评估以提高临床决策安全性。