2606.01051
2026-06-02
cs.LG
Interaction-Limited Safe Continuous-Time RL for Dynamical Medical Treatment
交互受限的动态医疗安全连续时间强化学习
Xun Shen, Yuepeng Wang, Akifumi Wachi, Yongqi Zhou, Richard Weiss, Yoshihiko Fujisawa, Ken Kawano, Mehrshad Sadria, Ying Chen, Xin Liu, Sebastien Gros, Xiao Hu, Kyoung-Sook Kim, Mengmou Li, Katsuki Fujisawa, Kenji Wakabayashi
发表机构
*
Tokyo University of Agriculture and Technology(东京大学农业技术大学)
;
LY Corporation(LY公司)
;
National University of Singapore(新加坡国立大学)
;
Institute of Science Tokyo(东京科学研究所)
;
Altos Labs, Inc.(Altos实验室)
;
National Institute of Advanced Industrial Science and Technology (AIST)(国家先进工业科学与技术研究院)
;
Norwegian University of Science and Technology(挪威科学技术大学)
;
Emory University(埃默里大学)
;
Hiroshima University(广岛大学)
AI总结
提出交互受限的安全连续时间强化学习框架,通过选项式半马尔可夫决策过程联合优化治疗策略与临床交互时机,并引入安全收紧机制保证轨迹级安全。