Avsnitt

153. Kan man lura AI? – Evaluations och LLM-as-a-judge

Dela

I avsnitt 153 pratar Erik och Dick om hur man bygger och kvalitetssäkrar AI-agenter. Med exempel på hur chatbotar kan “luras” går de igenom vad evaluations (evals) är, hur LLM-as-a-judge fungerar och hur företag använder detta för att förbättra sina AI-system över tid. De diskuterar också feedbackloopar, skillnaden mellan offline och online-utvärdering samt varför human in the loop fortfarande är avgörande. Ett avsnitt för dig som vill förstå hur AI-produkter fungerar bakom kulisserna

Rss Apple Podcaster

Podden och tillhörande omslagsbild på den här sidan tillhör Erik Hultgren och Dick Lyhammar. Innehållet i podden är skapat av Erik Hultgren och Dick Lyhammar och inte av, eller tillsammans med, Poddtoppen.

Avsnitt sparat!

Du hittar sparade avsnitt på Mina sidor.

Kunde inte spara avsnitt

Något gick fel. Försök igen.