强化学习样本是训练多智能体(Multi-Agent)强化学习模型的核心数据集,广泛应用于复杂环境下的协作与竞争场景。以下是关键内容概览:
📌 样本类型
- 集中式训练分散式执行(CTDE):如
StarCraft II
中的多智能体对战样本 - 完全合作型:如
Ants
协作搬运资源的轨迹数据 - 竞争对抗型:如
AlphaStar
的博弈决策记录 - 混合任务型:包含探索与利用的多阶段样本
🧠 应用场景
- 游戏AI:
Dota 2
、Go
等策略游戏的智能体交互数据 - 机器人集群:多机器人路径规划与避障样本
- 交通系统:自动驾驶车辆的协同导航数据
- 经济模拟:市场参与者的策略博弈样本