Patrick and Jason introduce reinforcement learning and place it alongside supervised and unsupervised learning. They cover Q-learning, SARSA, policy gradients, actor-critic methods, PPO, imitation learning, and why training and evaluating RL systems is so challenging.

Podden och tillhörande omslagsbild på den här sidan tillhör Patrick Wheeler and Jason Gauci. Innehållet i podden är skapat av Patrick Wheeler and Jason Gauci och inte av, eller tillsammans med, Poddtoppen.