你可能会发现,这个电脑对手的应对异常地狡黠和难以捉摸。这是因为它的决策不是随机的,也不是写死的规则,而是基于纳什均衡 (Nash Equilibrium) 求解出来的最优混合策略。
本游戏的博弈状态由 (玩家能量, CPU能量) 唯一决定。在任何一个状态下,如果总是选择特定的出招(纯策略),极易被对手看穿并反制。因此,最理性的决策是按一定的概率比例随机出招(混合策略)。
例如,当双方能量均为 0 且无法攻击时,唯一的均衡选择是 100% 蓄气(概率 [1.0, 0.0, 0.0])。但在如 (1, 1) 这种微妙的状态下,纳什均衡计算出的 CPU 决策概率为:蓄气约 28.9%,防御约 54.3%,攻击约 16.8%。在该均衡下,无论你采用何种对策,CPU 的期望胜率都将立于不败之地。这就是博弈论的魅力所在。