

Clémentine Fourrier
Lead maintainer of HuggingFace’s OpenLLM Leaderboard, a platform for standardizing and reproducing LLM evaluations.
Best podcasts with Clémentine Fourrier
Ranked by the Snipd community

67 snips
Jul 12, 2024 • 58min
Benchmarks 201: Why Leaderboards > Arenas >> LLM-as-Judge
Clémentine Fourrier, lead maintainer of Hugging Face’s OpenLLM Leaderboard, shares her journey from geology to AI. She discusses the urgent need for standardized benchmarks in model evaluations as traditional metrics become outdated. Clémentine tackles the challenges of creating fair, community-driven assessments while addressing biases and resource limitations. She also highlights innovations like long-context reasoning benchmarks and predicts future advancements in LLM capabilities, emphasizing the importance of calibration for user trust.

13 snips
Sep 11, 2025 • 59min
Évaluation des IA : souffler dans l'algotest
Dans cet échange captivant, Alban Leveau-Vallier, docteur en philosophie à Sciences Po, et Clémentine Fourrier, chercheuse en IA chez Hugging Face, explorent les enjeux critiques de l'évaluation des intelligences artificielles. Ils interrogent la similitude entre l'intelligence humaine et machine à travers des benchmarks. Les discussions révèlent les préoccupations éthiques autour des tests d'intelligence, les implications de l'obsession pour l'intelligence artificielle et les dangers historiques qu'elle évoque.