强化学习(Reinforcement Learning,RL)作为机器学习领域的重要学习方法,主要研究智能体如何根据当时的环境做出较好的决策,被认为是真实世界的缩影,是最有希望实现人工智能这个目标的研究领域之一。为此,本书致力于研究强化学习的统计方法,并为所提出的方法提供理论及实验方面的支持。