L'IA vient de passer un cap énorme (mais personne n'en parle)

34 snips

Jul 3, 2025

Guest

Grégoire Mesnil

Guest

Clémentine Fourrier

Clémentine Fourrier, membre de l'équipe d'évaluation chez Hugging Face, et Grégoire Mesnil, expert en agents chez Meta, explorent les frontières de l'IA. Ils discutent des défis de l'évaluation des modèles de langage à grande échelle et de l'importance de créer des benchmarks efficaces. L'impact d'OpenAI sur l'évolution des capacités des IA est également abordé, tout comme l'optimisation des modèles via des outils externes. Les intervenants mettent en lumière les progrès réalisés grâce à l'apprentissage par renforcement et les limites du prompting avancé.

Ask episode

AI Snips

Chapters

Transcript

Episode notes

ANECDOTE

Choc avec Deep Research

**Choc avec Deep Research
**

Micode raconte son choc en découvrant la fonction Deep Research d'OpenAI qui fait travailler le modèle plusieurs minutes.
Il a pu obtenir des réponses complexes et précises sur des besoins spécifiques, inaccessibles avant.

INSIGHT

Benchmark saturés, mais progrès réels

Les premiers benchmarks ont saturé car trop faciles pour les progrès actuels des modèles.
Gaïa mesure des capacités plus complexes, indiquant que les vrais progrès sont sur des tâches difficiles et longues.

INSIGHT

Agents dynamisent les performances

L'usage d'orchestrations et d'agents a marqué un premier boom de progrès sur Gaïa.
Ces techniques étendent les capacités des modèles en les faisant raisonner et agir par étapes multiples.

Get the Snipd Podcast app to discover more snips from this episode

Get the app

L'IA vient de passer un cap énorme (mais personne n'en parle)

**Choc avec Deep Research**

Benchmark saturés, mais progrès réels

Agents dynamisent les performances

Choc avec Deep Research