La Science, CQFD

Évaluation des IA : souffler dans l'algotest

13 snips
Sep 11, 2025
Dans cet échange captivant, Alban Leveau-Vallier, docteur en philosophie à Sciences Po, et Clémentine Fourrier, chercheuse en IA chez Hugging Face, explorent les enjeux critiques de l'évaluation des intelligences artificielles. Ils interrogent la similitude entre l'intelligence humaine et machine à travers des benchmarks. Les discussions révèlent les préoccupations éthiques autour des tests d'intelligence, les implications de l'obsession pour l'intelligence artificielle et les dangers historiques qu'elle évoque.
Ask episode
AI Snips
Chapters
Books
Transcript
Episode notes
INSIGHT

Benchmarks Mesurent Une Illusion De Compréhension

  • Les LLM impressionnent par leurs prouesses mais posent la question de ce qui constitue « comprendre ».
  • Les benchmarks servent à mesurer cette proximité avec l'intelligence humaine.
INSIGHT

Engagement Versus Efficacité

  • Un bon agent conversationnel peut être celui qui retient l'utilisateur longtemps ou qui répond efficacement puis libère son temps.
  • Le critère commercial et le critère d'efficacité peuvent entrer en tension éthique.
INSIGHT

Compétences Multiples Requises

  • Un agent doit combiner connaissance, compétences spécialisées, mémoire de conversation et capacité à utiliser des outils.
  • L'évolution récente ajoute l'aptitude à interagir avec des services externes pour agir comme assistant.
Get the Snipd Podcast app to discover more snips from this episode
Get the app