📚 Stable Baselines3 文档指南

Stable Baselines3 是一个用于强化学习的高效训练库，基于 Stable Baselines 项目，支持多种算法（如 PPO、A2C、DQN 等）。以下是核心内容概览：

🎯 特点速览

初始化环境：

from stable_baselines3 import PPO
from gym import make
env = make('CartPole-v1')

训练模型：

model = PPO('MlpPolicy', env, verbose=1)
model.learn(total_timesteps=10000)

*图示：强化学习的核心概念*

如需探索更多功能，可访问 Stable Baselines3 官方文档获取完整 API 参考。