Convolutional Neural Networks For Automatic State-Time Feature Extraction in Reinforcement Learning Applied to Residential Load Control
卷积神经网络用于强化学习中的自动状态-时间特征提取用于住宅负荷控制
AI总结 本文提出使用卷积神经网络提取隐藏状态-时间特征,以缓解部分可观测性带来的 curse,通过拟合 Q-迭代的监督学习步骤估计状态-动作值函数,验证了该方法在住宅负荷控制中的有效性。
Comments Submitted to Transactions on Smart Grid