

Clémentine Fourrier
Lead maintainer of HuggingFace’s OpenLLM Leaderboard, a platform for standardizing and reproducing LLM evaluations.
Best podcasts with Clémentine Fourrier
Ranked by the Snipd community

67 snips
Jul 12, 2024 • 58min
Benchmarks 201: Why Leaderboards > Arenas >> LLM-as-Judge
Clémentine Fourrier, lead maintainer of Hugging Face’s OpenLLM Leaderboard, shares her journey from geology to AI. She discusses the urgent need for standardized benchmarks in model evaluations as traditional metrics become outdated. Clémentine tackles the challenges of creating fair, community-driven assessments while addressing biases and resource limitations. She also highlights innovations like long-context reasoning benchmarks and predicts future advancements in LLM capabilities, emphasizing the importance of calibration for user trust.

10 snips
Jul 3, 2025 • 1h 19min
L'IA vient de passer un cap énorme (mais personne n'en parle)
Clémentine Fourrier, membre de l'équipe d'évaluation chez Hugging Face, et Grégoire Mesnil, expert en agents chez Meta, explorent les frontières de l'IA. Ils discutent des défis de l'évaluation des modèles de langage à grande échelle et de l'importance de créer des benchmarks efficaces. L'impact d'OpenAI sur l'évolution des capacités des IA est également abordé, tout comme l'optimisation des modèles via des outils externes. Les intervenants mettent en lumière les progrès réalisés grâce à l'apprentissage par renforcement et les limites du prompting avancé.