在所有的强化学习环境中,最简单的强化学习环境是仅仅涉及少数的状态,而且很容易给出对应奖励的强化学习环境。在第2章中,我们已经接触了两个这种类型的强化学习环境。对于这些强化学习环境,我们可以简单地写出一个实现。下面回顾一下这些环境,并给出一些常见的其他简单的强化学习环境。