10.4.2 零和博弈最优调节的增量值迭代算法