Underscore_ cover image

S5E18 - Non, l'IA ne stagne pas (on mesure juste les mauvaises choses)

Underscore_

00:00

Évaluation des Modèles d'IA

Ce chapitre explore les défis liés à l'évaluation des modèles d'intelligence artificielle, en mettant l'accent sur l'importance des benchmarks. Les intervenants partagent leurs expériences personnelles et professionnelles dans le domaine, y compris des discussions sur les outils comme le Open LLM Leaderboard et le projet Gaïa. La conversation aborde également les avancées technologiques récentes et la nécessité d'une évaluation rigoureuse pour assurer la fiabilité des agents intelligents.

Transcript
Play full episode

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!
App store bannerPlay store banner
Get the app