RL 数学基础

机器学习中的强化学习（Reinforcement Learning，简称 RL）与数学紧密相关。以下是一些 RL 中常用的数学概念和公式。

常用数学概念

以下是一个强化学习中的常见公式：

$$ Q(s, a) = \sum_{s' \in S} Q(s', a) \pi(a | s) + \gamma \max_{a' \in A} Q(s', a') $$

其中，$Q(s, a)$ 表示在状态 $s$ 下采取动作 $a$ 的期望回报，$\pi(a | s)$ 表示在状态 $s$ 下采取动作 $a$ 的概率，$\gamma$ 是折扣因子。

想要深入了解 RL 的数学基础？可以阅读以下本站链接：