Évaluation des IA : souffler dans l'algotest

28 snips

Sep 11, 2025

Guest

Clémentine Fourrier

Guest

Alban Leveau-Vallier

Dans cet échange captivant, Alban Leveau-Vallier, docteur en philosophie à Sciences Po, et Clémentine Fourrier, chercheuse en IA chez Hugging Face, explorent les enjeux critiques de l'évaluation des intelligences artificielles. Ils interrogent la similitude entre l'intelligence humaine et machine à travers des benchmarks. Les discussions révèlent les préoccupations éthiques autour des tests d'intelligence, les implications de l'obsession pour l'intelligence artificielle et les dangers historiques qu'elle évoque.

Ask episode

AI Snips

Chapters

Books

Transcript

Episode notes

INSIGHT

Benchmarks Mesurent Une Illusion De Compréhension

Les LLM impressionnent par leurs prouesses mais posent la question de ce qui constitue « comprendre ».
Les benchmarks servent à mesurer cette proximité avec l'intelligence humaine.

INSIGHT

Engagement Versus Efficacité

Un bon agent conversationnel peut être celui qui retient l'utilisateur longtemps ou qui répond efficacement puis libère son temps.
Le critère commercial et le critère d'efficacité peuvent entrer en tension éthique.

INSIGHT

Compétences Multiples Requises

Un agent doit combiner connaissance, compétences spécialisées, mémoire de conversation et capacité à utiliser des outils.
L'évolution récente ajoute l'aptitude à interagir avec des services externes pour agir comme assistant.

Get the Snipd Podcast app to discover more snips from this episode

Get the app