
Évaluation des IA : souffler dans l'algotest
La Science, CQFD
00:00
Intro
Ce chapitre examine les benchmarks utilisés pour mesurer les performances des modèles de langage en intelligence artificielle. Les intervenants discutent des enjeux associés à ces évaluations et questionnent la similitude entre l'intelligence artificielle et humaine.
Transcript
Play full episode