Avsnitt

180: Reinforcement Learning

Dela

Patrick and Jason introduce reinforcement learning and place it alongside supervised and unsupervised learning. They cover Q-learning, SARSA, policy gradients, actor-critic methods, PPO, imitation learning, and why training and evaluating RL systems is so challenging.

Rss Apple Podcaster

Podden och tillhörande omslagsbild på den här sidan tillhör Patrick Wheeler and Jason Gauci. Innehållet i podden är skapat av Patrick Wheeler and Jason Gauci och inte av, eller tillsammans med, Poddtoppen.

Avsnitt sparat!

Du hittar sparade avsnitt på Mina sidor.

Kunde inte spara avsnitt

Något gick fel. Försök igen.