
Underscore_ Génération IA d’images: 4 ans de recherche résumés en 20 minutes — chronique Michaël de Marliave
13 snips
Nov 13, 2025 Dans ce podcast, Michaël explore la conception d'un outil d'IA révolutionnaire pour la gestion des podcasts. Il discute des principes de diffusion et des auto-encodeurs, ainsi que de l'équilibre entre créativité et mémorisation. L'importance de la combinaison de CLIP avec les données massives est mise en avant, tout en abordant l'édition non destructive et l'utilisation de templates de prompt pour la génération de miniatures. Les cas d'usage et les défis techniques enrichissent ce retour d'expérience fascinant sur l'innovation en IA.
AI Snips
Chapters
Transcript
Episode notes
Principe Du Débruitage
- Les modèles de diffusion apprennent à reconstruire des images en retirant du bruit étape par étape pour générer des variantes créatives à partir d'un texte.
- Cette méthode permet de partir de bruit pur et d'obtenir des images cohérentes correspondant à une description textuelle.
Texte-Image Dans Un Même Espace
- L'association d'un modèle de diffusion avec CLIP permet de représenter texte et image dans le même espace vectoriel et de générer des images pour n'importe quel texte.
- Cette combinaison a déclenché la révolution actuelle des images générées par IA.
Filtrer Les Données Web
- Les datasets massifs proviennent d'Internet (Common Crawl) et nécessitent un filtrage esthétique pour retenir les images utiles.
- Des modèles de scoring esthétique entraînés sur des annotations humaines permettent de sélectionner des images de haute qualité.
