Maturing Markov Decision Processes: Decision Making under Increasing Information and Shrinking Action Sets
成熟马尔可夫决策过程:信息增加与动作集缩小下的决策制定
发表机构 * Ant International(蚂蚁国际) ; School of Economics, Sichuan University(四川大学经济学院) ; School of Economics, Fudan University(复旦大学经济学院)
专题命中 其他LLM :提出MMDP框架,结构感知强化学习,与LLM弱相关
AI总结 针对决策过程中信息增加与动作集缩小的不对称性,提出成熟马尔可夫决策过程(MMDP)框架,并基于过期动作优先级原则开发结构感知强化学习方法,实验证明其能提升学习效率。
Comments 25 pages, 9 figures