
S5E18 - Non, l'IA ne stagne pas (on mesure juste les mauvaises choses)
Underscore_
00:00
Évaluation des Modèles d'IA
Ce chapitre explore les défis liés à l'évaluation des modèles d'intelligence artificielle, en mettant l'accent sur l'importance des benchmarks. Les intervenants partagent leurs expériences personnelles et professionnelles dans le domaine, y compris des discussions sur les outils comme le Open LLM Leaderboard et le projet Gaïa. La conversation aborde également les avancées technologiques récentes et la nécessité d'une évaluation rigoureuse pour assurer la fiabilité des agents intelligents.
Transcript
Play full episode