Monde Numérique (Actu Tech)

🎤 Interview – L’IA qui parle (et écoute) en temps réel (Patrick Pérez, Kyutai)

Oct 29, 2025
Patrick Pérez, directeur général du laboratoire Kyutai, dévoile les avancées fascinantes de l'IA vocale open source. Il discute de Moshi, une IA capable de converser sans interruption et de saisir les émotions sans passer par la transcription. Pérez présente également Ibiki, une innovation de traduction simultanée qui préserve la voix originale. Avec un financement par mécénat, Kyutai se concentre sur la recherche fondamentale pour faire progresser l'écosystème mondial des IA, tout en encourageant l'open source.
Ask episode
AI Snips
Chapters
Transcript
Episode notes
INSIGHT

Laboratoire Non Lucratif et Ouvert

  • Kyutai est un laboratoire Ă  but non lucratif dĂ©diĂ© Ă  la recherche fondamentale en IA open source.
  • Il partage modèles et code pour accĂ©lĂ©rer la recherche plutĂ´t que pour produire des services commerciaux.
ANECDOTE

Moshi: Conversation Vocale Naturelle

  • Moshi est un prototype vocal dĂ©voilĂ© en juillet 2024 puis open source, conçu pour converser sans tour de parole imposĂ©.
  • Il comprend, coupe la parole Ă  bon escient et prĂ©serve le timbre et l'Ă©motion en Ă©vitant la transcription textuelle intermĂ©diaire.
INSIGHT

Codec Audio Comme Brique Fondatrice

  • Kyutai a créé un codec audio IA qui compresse l'audio tout en prĂ©servant le contenu pertinent pour l'IA.
  • Cette brique a Ă©tĂ© tĂ©lĂ©chargĂ©e des millions de fois et sert de fondation Ă  d'autres projets vocaux open source.
Get the Snipd Podcast app to discover more snips from this episode
Get the app