TensorFlow 强化学习教程：Cartpole 环境 🤖

Cartpole 是一个经典的强化学习入门问题，用于演示如何训练智能体保持平衡。通过这个例子，你可以了解 Q-Learning 和 深度强化学习 的基本原理。

🧠 问题简介

在 Cartpole 环境中，智能体需要控制一个滑块（Cart）移动，使上方的杆（Pole）保持不倒。目标是让杆尽可能长时间地保持平衡。

安装依赖
确保已安装 TensorFlow 和 Gym 环境：
```
pip install tensorflow gym
```
创建环境
使用 OpenAI Gym 的 CartPole-v1 环境：
```
import gym
env = gym.make('CartPole-v1')
```

设计神经网络
构建一个简单的深度 Q 网络（DQN）模型：

model = tf.keras.Sequential([
    tf.keras.layers.Dense(24, input_dim=4, activation='relu'),
    tf.keras.layers.Dense(2, activation='linear')
])

想深入学习 DQN 算法？可以查看我们的深度强化学习教程 📚