
L'IA vient de passer un cap énorme (mais personne n'en parle)
Underscore_
00:00
Évaluation des IA : défis et avancées
Ce chapitre explore le projet Gaïa, axé sur l'évaluation des capacités des modèles d'intelligence artificielle. Les intervenants discutent des défis liés à la création de benchmarks efficaces, en mettant en lumière l'évolution des méthodes d'évaluation et les obstacles rencontrés, tels que la triche et la contamination des données. Ils analysent également les avancées récentes dans le domaine des modèles de langage et leur impact sur la recherche et le développement en intelligence artificielle.
Transcript
Play full episode