Racem Flazi - Le Game cover image

IA : la douche froide, l'ère des agents - avec Karim et Wassim Jouini, experts français en IA | Ep35

Racem Flazi - Le Game

00:00

Apprentissage par renforcement et alignement

Wassim explique le RLHF, phases d'entraînement et comment il sert à aligner modèles sur préférences humaines.

Play episode from 41:10
Transcript

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!
App store bannerPlay store banner
Get the app