Argmax
Avsnitt

Mixture of Experts

Dela

In this episode we talk about the paper "Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer" by Noam Shazeer, Azalia Mirhoseini, Krzysztof Maziarz, Andy Davis, Quoc Le, Geoffrey Hinton, Jeff Dean.

Podden och tillhörande omslagsbild på den här sidan tillhör Vahe Hagopian, Taka Hasegawa, Farrukh Rahman. Innehållet i podden är skapat av Vahe Hagopian, Taka Hasegawa, Farrukh Rahman och inte av, eller tillsammans med, Poddtoppen.