强化学习样本是训练多智能体(Multi-Agent)强化学习模型的核心数据集,广泛应用于复杂环境下的协作与竞争场景。以下是关键内容概览:

📌 样本类型

  • 集中式训练分散式执行(CTDE):如StarCraft II中的多智能体对战样本
  • 完全合作型:如Ants协作搬运资源的轨迹数据
  • 竞争对抗型:如AlphaStar的博弈决策记录
  • 混合任务型:包含探索与利用的多阶段样本

🧠 应用场景

  • 游戏AIDota 2Go等策略游戏的智能体交互数据
  • 机器人集群:多机器人路径规划与避障样本
  • 交通系统:自动驾驶车辆的协同导航数据
  • 经济模拟:市场参与者的策略博弈样本

📘 学习资源

强化学习
多智能体系统
机器学习样本