TensorFlow 教程：Cartpole 问题示例 🚗🥅

欢迎来到 TensorFlow 的 Cartpole 示例教程！在这里，我们将通过一个经典控制问题，带你入门强化学习的基础概念。💡

什么是 Cartpole 问题？

Cartpole 是一个经典的强化学习任务，目标是通过控制力让小车保持平衡。🎯

小车在水平轨道上移动
杆子会因重力而下垂
每个动作（左推/右推）会带来不同的奖励
成功保持杆子直立 400 步即为胜利

代码示例（Python）

import gym
import tensorflow as tf

env = gym.make('CartPole-v1')
model = tf.keras.Sequential([
    tf.keras.layers.Dense(16, input_shape=(4,), activation='relu'),
    tf.keras.layers.Dense(2, activation='softmax')
])
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

训练结果可视化

训练过程中，我们可以用 TensorBoard 监控奖励曲线：📈

安装 TensorBoard: pip install tensorboard
启动 TensorBoard: tensorboard --logdir=logs
访问 https://cloud-image.ullrai.com/q/Cartpole_训练结果/ 查看实时数据

扩展学习

想了解更多？可以继续阅读：