
Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français
Aidez nous à améliorer le podcast en répondant à cette enquête rapide : https://form.typeform.com/to/n2lDjgQw
Merci par avance !
Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.
Dans ce podcast IA & Data (https://datadriven101.tech/) 100% en français, Marc Sanselme reçoit des professionnels de fonctions et d’horizons variés pour nous parler de leurs aventures, leurs succès, leurs échecs, leurs espoirs, leurs techniques, leurs astuces, leurs histoires et leurs convictions.
De la Business Intelligence à la Generative AI (LLM, RAG, Agents...) ou à la Computer Vision, toutes les thématiques liées à l'IA sont décortiquées épisode après épisode par Marc Sanselme et ses invités issus de la French tech et d'ailleurs.
Marc Sanselme est un spécialiste en Intelligence artificielle (https://scopeo.ai/marc-sanselme/) et dirige la société Scopeo, agence d'Intelligence Artificielle (https://scopeo.ai/).
Équipe : Clémence Reliat, Aïda Wali, Jean-Christophe Corvisier, Marc Sanselme
Hébergé par Ausha. Visitez ausha.co/fr/politique-de-confidentialite pour plus d'informations.
Latest episodes

Dec 24, 2023 • 10min
Best of - Anecdotes 1
Best of des épisodes de Data Driven 101 par thématiques.Dans cet épisode, les anecdotes de :Guillaume Jouffre de GreenGoLaure Lapostolle de QuitoqueAdrien Fenech de EstimeoNikolaj Groeneweg de Every.meCharles Sutton de DataScientestArnaud Delaunay de FarmwiseAlexis frentz de ElaiaHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Dec 17, 2023 • 38min
#43 Paul Maher (Directeur Général @ Coudac) : La “patate chaude” de la responsabilité des données
Paul Maher, Directeur Général de Coudac, un groupe de 6 agences marketing, est l’invité de l'épisode 43 de Data Driven 101. Il nous parle de Coudac, entreprise full-remote depuis sa création, aborde l’'importance du tracking server-side face aux restrictions des navigateurs, ou encore l'optimisation data-driven des campagnes publicitaires.Il souligne également l'avenir de la data chez eux, visant une gestion complète et efficace des données pour maximiser l'impact des dépenses marketing.Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Dec 10, 2023 • 42min
#42 Samuel Fillon (Fondateur @ Sommelier du parfum) : La data et l'IA au service de la parfumerie
Samuel Fillon, fondateur de Sommelier du Parfum, une start-up de machine learning dans la parfumerie, est l’invité de l'épisode 42 de Data Driven 101.
Il nous explique :
👉 Comment ils fournissent des outils data driven aux consommateurs et professionnels pour prendre des décisions rationnelles dans l'achat et la création de parfums.
👉 Comment ils développent des intelligences artificielles à partir de données olfactives et d’avis clients pour améliorer la recommandation de parfums.
👉 Quelles différences il y a entre des algorithmes de recommandation B2B et B2C.
🔑 MOTS CLÉS
Norme L2 : Mesure mathématique utilisée en statistiques et en apprentissage automatique pour quantifier la différence entre deux éléments.
Espace Sparse : Concept en science des données et en machine learning où la plupart des éléments d'un ensemble de données sont des zéros ou des valeurs non significatives.
Factorisation de Matrice : Technique mathématique utilisée en machine learning pour décomposer une matrice complexe en produits de matrices plus simples.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast : ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 5 : Laure Lapost olle (DG adjointe @ Quitoque) - Data et paniers repas
Épisode 16 : Chloé Dupuy (Manager Analytics Retail @ Catalina) : Comprendre le client
Épisode 27 : Valentin Geffrier (Senior Data Scientist @ Spotify) - Data, musique et streaming audio
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳
> Suivez-nous sur Tiktok 📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenant
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Dec 3, 2023 • 39min
#41 Christophe Lanternier (Head of Data @ Ubble) : Bâtir un pionnier de la vérification de documents d’identité
Christophe Lanternier, Head of Data chez Ubble, start-up de vérification de documents d’identité en ligne, est l’invité de l’épisode 41 de Data Driven 101.
Il nous raconte l’histoire du début, nous parle des défis techniques comme le manque de données et du développement des algorithmes en décomposant la pipeline algorithmique en détail, allant du cropping aux hologrammes en passant par la détection de visages.
Post-acquisition par Checkout.com, il nous parle également de l'amélioration de ses produits et des défis de l’international, en particulier la variété des documents internationaux.
🔑 MOTS CLÉS
Data Set: ensemble de données collectées et organisées pour une utilisation spécifique.
Computer Vision: domaine de l'informatique qui se concentre sur le développement de systèmes capables de traiter, analyser et comprendre des images numériques.
Feature Matching: Une technique en vision par ordinateur pour trouver des correspondances entre des éléments similaires (comme des points, des lignes, des formes) dans différentes images. C'est essentiel pour des tâches telles que la reconnaissance d'objets et la reconstruction 3D.
OCR (Optical Character Recognition): Une technologie qui permet de convertir différents types de documents, tels que des documents scannés, des images de texte, en texte modifiable et recherchable.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast : ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 8 : Arnaud Delau nay (Head of computer vision @ Farmwise) - Un robot agriculteur
Épisode 22 : Alexandre Han nebelle ( Head of Data @ Inarix ) : La mesure de qualité grâce à l’IA
Épisode 38 : Stanislas Po lu (Co-fondateur @ Dust) : Assistant personnel basé sur l’Intelligence Artificielle
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳
> Suivez-nous sur Tiktok 📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenantHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Nov 26, 2023 • 43min
#40 Jean-Philippe Couturier (fondateur @ Whoz) : Matcher des personnes et des projets grace à l’IA :
Jean-Philippe Couturier, fondateur de Whoz, est l’invité de l'épisode 40 de Data Driven 101.
Depuis le COVID 19, le télétravail s’est démocratisé et les ESN et cabinets de conseils font maintenant beaucoup de choses à distance.
Dans ces conditions, staffer des consultants sur des missions, change d’échelle.
Comment structurer les compétences et les besoins et comment utiliser l’IA pour proposer le meilleur staffing ?
Jean-Philippe Couturier nous explique comment ils abordent le problème chez Whoz et comment la compétence est devenue une monnaie dans le monde du travail.
🔑 MOTS CLÉS
DeepMind (Google) : Une entreprise spécialisée dans l'intelligence artificielle, connue pour ses avancées dans le domaine du deep learning et de l'IA en général, notamment avec son IA AlphaGo qui a battu tous les humains au jeu du Go.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast : ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 34 : Patrick Bar rabé (Consultant et conférencier) : Data, IT et retail “Brick and mortar”
Épisode 36 : Quentin Dubois (CTO @ OSS venture) : Data et manufacturing
Épisode 24 : David E l Kaïm (Sales director @ Bright Data) : Web scraping
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳
> Suivez-nous sur Tiktok 📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenantHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Nov 19, 2023 • 35min
#39 Marie Ramon-Daré (Cheffe de projet design & innovation @ Ecolab) : L’open Data au service de la santé et de l’environnement
Marie Ramon-Daré , cheffe de projet design et innovation au sein d’Ecolab, est l'invitée de l’épisode 39 de Data Driven 101.
Elle décrit les efforts pour structurer et optimiser l'utilisation des données dans le domaine de la santé environnementale, en abordant les défis techniques, légaux et politiques.
🔑 MOTS CLÉS
Épidémiologie environnementale : Branche de l'épidémiologie qui se concentre sur l'étude des facteurs environnementaux affectant la distribution et la fréquence des maladies et autres conditions de santé dans les populations.
Découvrabilité de la donnée : Facilité avec laquelle les utilisateurs peuvent trouver des données pertinentes.
Métadonnées : Ensemble de données qui décrivent et donnent des informations sur d'autres données.
Table de correspondance : Outil ou document qui permet de relier des informations ou des données de deux sources différentes, facilitant ainsi leur intégration et leur comparaison.
Catalogue de données : Répertoire organisé de données disponibles, souvent avec des informations sur la source, la qualité, et la manière d'accéder aux données.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast : ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 31 : Fabrice Bonnifet (Directeur du Développement Durable @ Bouygues ) : Data et Transition énergétique
Épisode 37 : Hugo Palmer (Manager Data @ Blablacar) : Data Mesh chez Blablacar
Épisode 19 : Victor Cluze l (Cour des comptes) : La data au service du contrôle des dépenses publiques
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳
> Suivez-nous sur Tiktok 📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenantHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Nov 12, 2023 • 44min
#38 Stanislas Polu (Co-fondateur @ Dust) : Assistant personnel basé sur l’Intelligence Artificielle
Stanislas Polu est notre invité de l’épisode 38 de Data Driven 101. Après avoir revendu sa start-up à Stripe et passé 3 ans chez OpenAI, il fonde Dust, un outil qui permet aux entreprises de déployer des assistants d'intelligence artificielle au sein de leurs équipes avec des intégrations simples.
Il partage avec nous sa vision concernant les défis et les opportunités liés à l'adoption de la technologie LLM au sein des entreprises.
🔑 MOTS CLÉS
Fine tuning : processus d'ajustement d'un modèle pré-entraîné pour l'adapter à une tâche spécifique.
Data Mesh : Concept architectural dans la gestion des données qui favorise une approche décentralisée, permettant à différentes équipes de gérer leurs propres données comme un produit.
Processing : Traitement de données ou de transactions, souvent utilisé dans le contexte des opérations de paiement ou de traitement de données en masse.
Scale (Scaler) : L'expansion rapide d'une entreprise ou d'une technologie, souvent utilisée pour décrire la croissance rapide d'une start-up technologique.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast : ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 33 : Guillaume Lample (Cofounder & Chief Scientist @ Mistral AI) : Les secrets des Large Language Models
Épisode 29 : Arthur André ( Co-fondateur @ Praiz ) : Synthétiser ses réunions grâce à l'IA
Épisode 21 : Édouard d'Archimbaud (CTO @ Kili Technology) : L'annotation de données
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳
> Suivez-nous sur Tiktok 📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenantHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Nov 5, 2023 • 27min
#37 Hugo Palmer (Manager Data @ Blablacar) : Data Mesh chez Blablacar
Hugo Palmer, Manager Data, chez Blablacar depuis 7 ans, est notre invité de l’épisode 37 de Data Driven 101. Il nous explique comment Blablacar utilise les données pour prendre des décisions business et opérationnelles, ainsi que pour améliorer l'expérience de ses utilisateurs.Il développe avec pédagogie ce qu’est le data mesh et ce qu’il apporte selon lui.
🔑 MOTS-CLÉS
Data mesh : une architecture de données décentralisée qui organise les données par domaine d'activité spécifique (par exemple, le marketing, les ventes, le service client, etc.).
🎙 SOUTENEZ LE PODCAST GRATUITEMENT
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast : ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 28 : Hugo Lime (Head of Data @ Matera) : Data et syndic de copropriété
Épisode 27 : Valentin Geffrier (Senior Data Scientist @ Spotify) - Data, musique et streaming
Épisode 1 : Antoine Sauvage (CTO @ Ovrsea ) - Data, transport et logistique
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳
> Suivez-nous sur Tiktok 📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenant
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Oct 22, 2023 • 35min
#36 Quentin Dubois (CTO @ OSS venture) : Data et manufacturing
Quentin Dubois, CTO de OSS Venture, start-up studio spécialisé dans le manufacturing pour créer des start-up dans un milieu encore peu digitalisé, est l’invité de l’épisode 36 de Data Driven 101. Il nous parle notamment du fond d’investissement, comment ils recrutent et aident les start-up, ou encore de leur thèse de digitalisation de l'industrie Franco européenne.
🔑 MOTS CLÉS
SGBD : Un système de gestion de base de données (SGBD) est le logiciel qui permet à un ordinateur de stocker, récupérer, ajouter, supprimer et modifier des données.
Data mining : processus qui consiste à extraire des informations à partir de données, en utilisant des techniques statistiques et informatiques.
Data warehouse : système informatique qui permet de stocker et d'organiser des données provenant de différentes sources, pour faciliter leur analyse et leur exploitation.
ERP ou Enterprise resource planning : logiciel pour organiser la vie de l’entreprise.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast : ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 2 : Victor Billette de Villemeur (Product Manager @ L'Oréal ) - Rester agile
Épisode 5 : Laure Lapos tolle (DG adjointe @ Quitoque) - Data et paniers repas
Épisode 9 : Alexis Frentz (Investment Manager @ Elaia) - Investir dans la data
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳
> Suivez-nous sur Tiktok 📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenant
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Oct 15, 2023 • 45min
#35 Nataniel Ruiz (Research Scientist @ Google Search) : Dreambooth, faire apprendre de nouveaux objets à une IA générative
Une photo de votre chien en train de faire du surf.
Voilà ni plus ni moins ce que permet de faire la méthode “dreambooth” co-inventée par ce chercheur.
Nataniel Ruiz, premier auteur du papier “Dreambooth” et Research Scientist chez Google Research au département creative camera, est l’invité de l’épisode 35 de Data Driven 101.
Il nous parle notamment des techniques génératives pour les images et les vidéos, et en particulier sur le papier Dreambooth. Il nous parle également de ses travaux sur les large languages models, ainsi que de l'importance de l'interaction entre la recherche et l'application pratique.
Références mentionnées dans le podcast :
GCP DreamBooth: https://cloud.google.com/vertex-ai/docs/generative-ai/image/fine-tune-model
GCP StyleDrop: https://cloud.google.com/vertex-ai/docs/generative-ai/image/fine-tune-style
DB SDXL Repo: https://github.com/replicate/cog-sdxl
🔑 MOTS CLÉS
Fine tuning : Il s'agit d'une technique d'apprentissage automatique qui consiste à ajuster un modèle pré-entraîné sur une tâche spécifique en utilisant un ensemble de données plus petit et plus spécifique.
GANs ou Réseaux antagonistes génératifs : en intelligence artificielle, les réseaux antagonistes génératifs parfois aussi appelés réseaux adverses génératifs sont une classe d'algorithmes d'apprentissage non supervisé.
Dataset : Un jeu de données, ou dataset, regroupe plusieurs données ayant un lien cohérent entre elles.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast : ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 33 : Guillaume Lample (Cofounder & Chief Scientist @ Mistral AI) : Les secrets des Large Language Models
Épisode HS1 : Nikolaj Groeneweg (Founder @ Everyme.ai) - Générer des images grâce à l'IA
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳
> Suivez-nous sur Tiktok 📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenantHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.