Underscore_

L'IA vient de passer un cap énorme (mais personne n'en parle)

10 snips
Jul 3, 2025
Clémentine Fourrier, membre de l'équipe d'évaluation chez Hugging Face, et Grégoire Mesnil, expert en agents chez Meta, explorent les frontières de l'IA. Ils discutent des défis de l'évaluation des modèles de langage à grande échelle et de l'importance de créer des benchmarks efficaces. L'impact d'OpenAI sur l'évolution des capacités des IA est également abordé, tout comme l'optimisation des modèles via des outils externes. Les intervenants mettent en lumière les progrès réalisés grâce à l'apprentissage par renforcement et les limites du prompting avancé.
Ask episode
AI Snips
Chapters
Transcript
Episode notes
ANECDOTE

**Choc avec Deep Research**

**Choc avec Deep Research
**

  • Micode raconte son choc en découvrant la fonction Deep Research d'OpenAI qui fait travailler le modèle plusieurs minutes.
  • Il a pu obtenir des réponses complexes et précises sur des besoins spécifiques, inaccessibles avant.
INSIGHT

Benchmark saturés, mais progrès réels

  • Les premiers benchmarks ont saturé car trop faciles pour les progrès actuels des modèles.
  • Gaïa mesure des capacités plus complexes, indiquant que les vrais progrès sont sur des tâches difficiles et longues.
INSIGHT

Agents dynamisent les performances

  • L'usage d'orchestrations et d'agents a marqué un premier boom de progrès sur Gaïa.
  • Ces techniques étendent les capacités des modèles en les faisant raisonner et agir par étapes multiples.
Get the Snipd Podcast app to discover more snips from this episode
Get the app