Stable Baselines3 是一个开源的强化学习库,它提供了多种强化学习算法的实现。以下是安装 Stable Baselines3 的步骤。
系统要求
- Python 3.6 或更高版本
- pip 或 conda
安装步骤
- 使用 pip 安装 Stable Baselines3:
pip install stable-baselines3
- 或者使用 conda 安装:
conda install -c conda-forge stable-baselines3
示例代码
以下是一个简单的示例,展示如何使用 Stable Baselines3 进行强化学习:
import gym
from stable_baselines3 import PPO
env = gym.make("CartPole-v1")
model = PPO("MlpPolicy", env, verbose=1)
model.learn(total_timesteps=10000)
扩展阅读
想要了解更多关于 Stable Baselines3 的信息,可以访问我们的官方文档。
图片展示
CartPole 环境