欢迎来到 TensorFlow 的 Cartpole 示例教程!在这里,我们将通过一个经典控制问题,带你入门强化学习的基础概念。💡
什么是 Cartpole 问题?
Cartpole 是一个经典的强化学习任务,目标是通过控制力让小车保持平衡。🎯
- 小车在水平轨道上移动
- 杆子会因重力而下垂
- 每个动作(左推/右推)会带来不同的奖励
- 成功保持杆子直立 400 步即为胜利
代码示例(Python)
import gym
import tensorflow as tf
env = gym.make('CartPole-v1')
model = tf.keras.Sequential([
tf.keras.layers.Dense(16, input_shape=(4,), activation='relu'),
tf.keras.layers.Dense(2, activation='softmax')
])
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
训练结果可视化
训练过程中,我们可以用 TensorBoard 监控奖励曲线:📈
- 安装 TensorBoard:
pip install tensorboard
- 启动 TensorBoard:
tensorboard --logdir=logs
- 访问 https://cloud-image.ullrai.com/q/Cartpole_训练结果/ 查看实时数据
扩展学习
想了解更多?可以继续阅读: