Stable Baselines3 是一个开源的强化学习库,它提供了多种强化学习算法的实现。以下是安装 Stable Baselines3 的步骤。

系统要求

  • Python 3.6 或更高版本
  • pip 或 conda

安装步骤

  1. 使用 pip 安装 Stable Baselines3:
pip install stable-baselines3
  1. 或者使用 conda 安装:
conda install -c conda-forge stable-baselines3

示例代码

以下是一个简单的示例,展示如何使用 Stable Baselines3 进行强化学习:

import gym
from stable_baselines3 import PPO

env = gym.make("CartPole-v1")
model = PPO("MlpPolicy", env, verbose=1)
model.learn(total_timesteps=10000)

扩展阅读

想要了解更多关于 Stable Baselines3 的信息,可以访问我们的官方文档

图片展示

CartPole 环境