强化学习论文资源

以下是一些强化学习领域的经典论文，供您参考和学习。

Q-Learning:
- Sutton, Richard S., and Andrew G. Barto. "Introduction to reinforcement learning." (1998).
Deep Q-Network (DQN):
- Mnih, Volodymyr, et al. "Playing Atari with deep reinforcement learning." arXiv preprint arXiv:1312.5602 (2013).
Policy Gradient:
- Sutton, Richard S., and Andrew G. Barto. "Reinforcement learning: An introduction." MIT press, 1998.
Asynchronous Advantage Actor-Critic (A3C):
- Mnih, Volodymyr, et al. "Asynchronous methods for deep reinforcement learning." arXiv preprint arXiv:1602.01783 (2016).

更多相关论文，您可以访问本站论文资源库进行扩展阅读。

Reinforcement_Learning

Deep_Q_Network

Policy_Gradient

A3C