

DataGen
Robin Conquet
DataGen est un podcast qui permet de comprendre les stratégies data des plus belles boîtes en France. Je m'appelle Robin Conquet et chaque semaine j'invite un expert de la data pour décrypter ses problématiques. BlaBlaCar, Doctolib, Pernod Ricard, Deezer et bien d'autres, dans ce podcast, tu découvriras comment les entreprises qui réussissent utilisent la data. Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
Episodes
Mentioned books

Nov 27, 2023 • 33min
#94 - CybelAngel : Implémenter une stratégie de Data Gouvernance en 5 piliers
Marie Sacksick, Head of Data chez CybelAngel, révèle son parcours inspirant dans la cybersécurité. Elle explique les cinq piliers d'une stratégie de Data Gouvernance qu'elle a dressée et présente les initiatives clés, comme le programme Data Experts. Les défis rencontrés dans la mise en place d'une telle stratégie sont discutés, tout comme les principales difficultés liées à l'ownership des données. Les bénéfices d'une gouvernance efficace sont également mis en avant, offrant un aperçu précieux pour toute entreprise désireuse d'optimiser son utilisation des données.

Nov 21, 2023 • 22min
#93 - Data For Good | Atelier OGRE : Comprendre la transition énergétique
Grégory Kotnarovsky, enseignant-chercheur à l'ESTA, a créé l’Atelier OGRE, un jeu dont le but est de sensibiliser aux enjeux énergétiques et aux ordres de grandeur qui y sont associés. Initialement un cours “gamifié” destiné aux étudiants, Atelier OGRE est devenu une application accessible aux entreprises et au grand public grâce à l’accélération fournie par Data for Good.On aborde :🔥 La genèse d’Atelier OGRE et son fonctionnement,🔥 Des exemples de décisions prises pendant l’Atelier,🔥 L’accélération et le rôle de Data for Good,🔥 Sa vision pour l’usage des données collectées pendant l’Atelier.---🎬 CHAPITRES00:00 Générique01:09 Introduction01:59 Le parcours de Grégory & la genèse d’Atelier OGRE03:53 Le fonctionnement de l’Atelier05:35 Des exemples de décisions prises pendant l’Atelier06:33 Atelier OGRE en chiffres08:26 Le rôle “d’évangélisation” de l’atelier16:38 L’accélération Data For Good18:22 L’utilisation des data récoltées pendant l’Atelier---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---📚 RESSOURCE- Le livre L'énergie durable : Pas que du vent !---🧐 AUTRES ÉPISODES#48 - Data For Good | Pyronear : Détecter les feux de forêt via l'IA#30 - Data For Good | BechdelAI : Détecter les films sexistes via l’IA#17 - Data For Good : Passer à l'action et accélérer des projets à impact---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

4 snips
Nov 15, 2023 • 25min
#92 - Saagie : Mettre en place une approche DataOps
Laurent Heurtin est VP Engineering chez Saagie, la start-up française ayant levé 30 millions d’euros qui édite un logiciel DataOps permettant d'accélérer la livraison des projets data.On aborde :🔥 Ce qu’est le DataOps en reprenant notamment la définition du Gartner,🔥 Dans quel contexte les entreprises adoptent une approche DataOps,🔥 Comment la mettre en place et quel est le rôle d’un outil comme Saagie,🔥 Le marché du DataOps, les bonnes pratiques et des cas concrets.---🎬 CHAPITRES00:00 Introduction03:28 Son parcours pour devenir VP Engineering04:43 Qu’est-ce que le DataOps ?06:34 Pourquoi mettre en place une approche DataOps ?08:15 Comment mettre en place cette approche ?10:47 Les bonnes pratiques DataOps13:43 Que fait un outil DataOps comme Saagie ?17:35 Quelques cas concrets sur son utilisation19:16 Focus sur le marché DataOps21:04 Airflow : un concurrent ?22:38 Les ressources recommandées par Laurent23:18 Ce que Laurent aime dans la data23:54 Ce qui l’a le plus fait progresser24:16 Le meilleur conseil qu’on lui ait donné24:40 Contacter Laurent pour en savoir plus sur Saagie---❤️ PARTENAIRESCe podcast est rendu possible par Business & Decision, le cabinet de conseil et services spécialisé sur la Data et l'IA du groupe Orange Business.Ce podcast est rendu possible par Saagie, la solution de DataOps qui permet d'accélérer la mise en production des projets data.👉 Demander un free trial.---📚 RESSOURCE- Le Blog DataOps de Saagie- La newsletter Data Products par Chad Sanderson---🧐 AUTRES ÉPISODES#78 - Air France : Assurer l’adoption des produits data#84 - Veepee : Utiliser les Data Contracts pour scaler sa Data Platform#67 - Les 4 tendances data de 2023 avec Christophe Blefari---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Nov 13, 2023 • 25min
#91 - Spendesk : Adopter l'approche Analytics Engineering
Jules Jeanroy est Analytics Engineer chez Spendesk, la licorne française aux 180 000 utilisateurs qui facilite les dépenses en entreprise. On aborde :🔥 Le parcours de Jules pour devenir Analytics Engineer,🔥 Ses plus gros chantiers : Modélisation de données et Self-Service,🔥 L’organisation des équipes Data chez Spendesk,🔥 L’utilisation de DBT dans le métier d'Analytics Engineer.---🎬 CHAPITRES00:00 Générique01:29 Introduction03:14 Le parcours de Jules05:14 Les plus gros chantiers de Jules en tant qu'Analytics Engineer : Modélisation de données et Self-Service09:41 L'orga des équipes Data chez Spendesk11:54 La collaboration avec les équipes métiers14:42 La priorisation des projets Data16:42 L’utilisation de DBT dans le métier d'Analytics Engineer18:36 Le plus gros challenge de Jules : faire gagner l'équipe en visibilité20:23 Les next steps de l'équipe Analytics Engineering : Monitoring et Observabilité21:37 Les ressources recommandées par Jules21:58 Ce qu'il aime dans la data22:24 Ce qui l’a le plus fait progresser23:09 Le meilleur conseil qu’on lui ait donné---❤️ PARTENAIRECe podcast est rendu possible par Business & Decision, le cabinet de conseil et services spécialisé sur la Data et l'IA du groupe Orange Business.---📚 RESSOURCE- La newsletter Blef.fr---🧐 AUTRES ÉPISODES#26 - Swile : Intégrer l’Analytics Engineering dans son organisation Data#20 - Gorgias : Migrer vers la Modern Data Stack#14 - Aircall : Faire scaler l'impact de l'équipe data sur l'entreprise---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

4 snips
Nov 6, 2023 • 35min
#90 - Ovrsea : Mettre en place une approche Self-Service
Juliette Duizabo est Head of Data chez Ovrsea, la startup qui propose un service de transport de containers pour les entreprises. Ils ont 500 clients, 150 collaborateurs et sont seulement … 3 en Data !On aborde :🔥 Les avantages et inconvénients du Self-Service,🔥 Les étapes pour mettre en place cette approche,🔥 Comment ça fonctionne opérationnellement et le rôle clé des Data Champions,🔥 La stack data d’Ovrsea (DBT, AWS, Stitch, Airflow, MetaBase, GitHub…).---🎬 CHAPITRES00:00 Générique01:42 Introduction03:02 Le parcours de Juliette05:07 Pourquoi mettre en place une approche Self-Service chez Ovrsea07:03 Le self-service, opérationnellement ça donne quoi ?11:55 La stack Data d’Ovrsea16:01 Les grandes étapes de la mise en place du Self-Service20:57 Les avantages du Self-Service22:40 Les inconvénients du Self-Service25:02 Le conseil de Juliette pour adopter cette approche28:44 Les projets à venir de l'équipe Data29:40 Les ressources recommandées par Juliette40:34 Ce qu'elle aime dans la data31:11 Ce qui l’a le plus fait progresser31:46 Le rituel des équipes chez Ovrsea33:03 Le meilleur conseil qu'on lui a donné---❤️ PARTENAIRECe podcast est rendu possible par Business & Decision, le cabinet de conseil et services spécialisé sur la Data et l'IA du groupe Orange Business.---📚 RESSOURCE- The Data Team Handbook de GitLab---🧐 AUTRES ÉPISODES#77 - Sunday : Scaler grâce à une orga Data Mesh#51 - Nickel : Rendre les équipes métier plus autonomes#31 - Ankorstore : Monter une équipe Business Analytics---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Oct 30, 2023 • 36min
#89 - Therapixel : Détecter le cancer grâce à l’IA
🎁 LIEN VERS LE FORMULAIRE A REMPLIR (2 MIN) POUR TENTER DE GAGNER DES AIRPODS 3E : https://bit.ly/48AppYP 🎁---Yaroslav Nikulin est Head of AI chez Therapixel, la pépite française qui détecte les cancers en se basant sur l’imagerie médicale grâce à l’IA. Après avoir levé 15 millions d’euros en 2022, ils se sont déjà implantés dans une quarantaine d’hôpitaux.On aborde :🔥 Le parcours de Yaroslav (Polytechnique, ENS Cachan …) et la genèse de Therapixel,🔥 Le contexte lié à la détection du cancer, le fonctionnement de l’algorithme et ses principaux chantiers en tant qu’Head of AI (ex : passer d’un proof of concept à un produit qui fonctionne),🔥 L’organisation des équipes chez Therapixel (ex : IA, Data, Dev, Clinique, Commerciale),🔥 Dans quelle mesure les nouvelles IA génératives telles que ChatGPT constituent un risque pour les startups IA.---🎬 CHAPITRES00:00 Générique01:59 Introduction02:58 Présentation de Therapixel04:08 Le parcours de Yaroslav05:49 Comment fonctionne le produit10:10 Les principaux chantiers de Yaroslav14:17 L’organisation des équipesnchez Therapixel20:50 Les outils Data Science utilisés par l’équipe IA23:08 Les plus grosses difficultés qu’il a rencontrées26:00 Les prochaines étapes de Therapixel27:47 La vision de Yaroslav sur ChatGPT32:21 Les ressources recommandées par Yaroslav33:22 Ce qu'il aime dans la data34:14 Ce qui l’a le plus fait progresser---❤️ PARTENAIRECe podcast est rendu possible par Rivery.Demandez une démo du produit ici.---📚 RESSOURCELe livre Iacocca: An Autobiography---🧐 AUTRES ÉPISODES#80 - ChatGPT et la tendance des LLM avec Marc Sanselme#74 - BlaBlaCar : Adopter une approche Produit en Data Science#16 - Veepee : Développer un moteur de recommandation pour personnaliser son site---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Oct 19, 2023 • 33min
#88 - Inclusion In Data | Créer une équipe inclusive avec Sébastien Garcin
📢 Nouvel épisode sur la diversité et l'inclusion dans la Data avec Clara Mendes Sampaio en tant qu'animatrice. 📢Sébastien Garcin est l'ex-Chief Marketing and Data Officer de L'Oréal et est aujourd'hui le Cofondateur de YZR, le SaaS B2B qui automatise des tâches de mise en qualité de données via l'IA. Sébastien est ce qu'on appelle "un allié", il a mis le sujet de l'inclusion au coeur de son équipe.On aborde :🔥 Sa prise de conscience lorsqu'ils étaient une jeune équipe uniquement constituée d'hommes,🔥 Les actions qu'ils ont mis en place par la suite pour créer une équipe inclusive,🔥 Le décryptage d’une étude Baromètre Sista sur le sujet de l'inclusion au sein de l'écosystème startup,🔥 Sa vision sur les quotas, quelques anecdotes et ses conseils pour créer une équipe inclusive.---🧐 AUTRES ÉPISODES#61 - Inclusion In Data | Le management au féminin et les quotas avec Christelle Marfaing#43 - Inclusion In Data | Paris Data Ladies : Promouvoir la parole des femmes---📚 RESSOURCESWomen led startups losing across the board: from creation to funding, in all key European markets de Sista x BCG---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰------👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

9 snips
Oct 13, 2023 • 35min
#87 - Dinmo : Le Reverse ETL des équipes Métier
Oussama Ghanmi a été Chief Data Officer chez Ornikar (scaleup valorisée plus de 600 millions d’euros) et Directeur au sein du cabinet de conseil en data M13h. Aujourd’hui, il a lancé un nouvel outil de Reverse ETL à destination des équipes Métier : Dinmo. L’objectif est d’autonomiser les équipes Métier dans l’activation des données et aussi de permettre aux équipes Data de se concentrer sur les projets à forte valeur ajoutée.On aborde :🔥 Son parcours, d’Ornikar à Dinmo, en passant par le conseil,🔥 Ce qu’est un reverse-ETL et comment Dinmo se positionne sur ce marché,🔥 Les principales difficultés qu’Oussama a rencontrées : l'aventure entrepreneuriale en tant que solo-founder, trouver les premiers clients pour co-designer la solution,🔥 L’enjeu de souveraineté technologique lié au développement de pépites data Française.---🎬 CHAPITRES00:00 Générique00:57 Introduction01:30 Le parcours d'Oussama de CDO à entrepreneur en passant par le conseil05:29 Oussama définit les concepts d’ETL et de Reverse ETL07:17 La genèse de Dinmo10:52 L'avantage comparatif de Dinmo sur le marché18:00 Pourquoi le serf-service est indispensable pour scaler ?20:19 Les difficultés rencontrées dans le développement du produit28:46 Les next steps de Dinmo31:42 Les ressources recommandées par Oussama32:25 Ce qu'il aime dans la data33:07 Ce qui l’a le plus fait progresser34:06 Tester Dinmo---❤️ PARTENAIRECe podcast est rendu possible par Dinmo, l’outil de Reverse ETL développé par Oussama.👉 Demandez une démo du produit ici.---📚 RESSOURCES- Modern Data Network (MDN)- Locally Optimistic---🧐 AUTRES ÉPISODES#76 - FLOA : Créer une organisation data autonome#75 - Fabric : L'alternative de Microsoft à la Modern Data Stack ?#45 - Voyage Privé : Migrer vers la Modern Data Stack---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles sur Apple Podcasts ici 🥰---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

4 snips
Oct 10, 2023 • 37min
#86 - Vestiaire Collective : Développer un algorithme d’automatisation pour scaler
🎁 LIEN VERS LE FORMULAIRE A REMPLIR (2 MIN) POUR TENTER DE GAGNER DES AIRPODS 3E : https://bit.ly/48AppYP 🎁---Adrien Marteau est Head of Data Science chez Vestiaire Collective, la licorne qui permet à ses utilisateurs de vendre et d’acheter des articles mode de seconde main. En grandissant, les équipes responsables d’authentifier les articles sont vite devenues débordées. Ils ont donc développé un algorithme pour automatiser les mises en ligne les plus simples, permettant aujourd’hui d’ajouter 1 demi-million d’articles chaque mois !On aborde :🔥 Le parcours d'Adrien et ses débuts en tant que 1er Data Scientist chez Vestiaire Collective,🔥 Son plus gros challenge : développer un algorithme pour automatiser la mise en ligne des articles,🔥 Les principales difficultés qu’il a rencontrées : la sélection des données utilisées, l’identification du bon niveau d’automatisation et le monitoring de la performance de l’algorithme.🔥 Le fonctionnement de l’algorithme et l’organisation de l’équipe Data.---🎬 CHAPITRES00:00 Générique02:03 Introduction01:52 L’organisation de l’équipe Data chez Vestiaire Collective06:44 Le parcours d'Adrien et ses débuts en tant que premier Data Scientist09:40 Leurs enjeux d'automatisation13:43 Du Proof of Concept au modèle actuel21:26 Le process itératif mis en place avec l'équipe Métier25:43 Le fonctionnement de l'algorithme26:18 L'équipe technique derrière l'algorithme28:07 Les plus grosses difficultés d'Adrien (accessibilité des données, niveau d’automatisation, drifting)31:19 Les ressources recommandées par Adrien33:17 Ce qu'il aime dans la data34:34 Ce qui l’a le plus fait progresser35:25 Le meilleur conseil qu'on lui a donné---❤️ PARTENAIRECe podcast est rendu possible par Rivery.Demandez une démo du produit ici.---📚 RESSOURCES- The Visual Display of Quantitative Information- The Design Of Everyday Things- Mindset: The New Psychology of Success- La newsletter de Jean-Charles Samuelian- La newsletter Neuron---🧐 AUTRES ÉPISODES#30 - Data For Good | BechdelAI : Détecter les films sexistes via l’IA#16 - Veepee : Développer un moteur de recommandation pour personnaliser son site---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

20 snips
Oct 5, 2023 • 27min
#85 - Masterclass | Comprendre la Modern Data Stack avec Matthieu Rousseau
ECOUTER LE 2EME EPISODE SUR LA MODERN DATA STACK (#203) AVEC MATTHIEU---Matthieu Rousseau est un expert en Data Engineering et a lancé Modeo, un cabinet de conseil spécialisé sur la mise en place de Modern Data Stack.On aborde :🔥 La différence entre une stack traditionnelle et une Modern Data Stack,🔥 Les étapes pour la mettre en place : Audit, Data Warehouse, Ingestion, Orchestration, Transformation, etc.🔥 Les difficultés lorsqu’on met en place une stack data : la mesure de l’impact et de l’usage,🔥 Les conseils de Matthieu pour mettre en place adopter une Modern Data Stack.---🎬 CHAPITRES00:00 Générique 01:42 Introduction02:52 Le parcours de Matthieu05:11 La différence entre une stack traditionnelle et une “Modern Data Stack”06:53 Les étapes pour mettre en place une Modern Data Stack21:11 Les difficultés que l'on rencontre en mettant en place une Modern Data Stack22:09 Les conseils de Matthieu pour mettre en place sa Modern Data Stack23:26 Les ressources recommandées par Matthieu24:04 Ce qu'il aime dans la data24:40 Ce qui l’a le plus fait progresser25:12 Le meilleur conseil qu'on lui a donné25:46 Contacter Matthieu---❤️ PARTENAIRESCe podcast est rendu possible par Rivery, l'ETL qui bouscule le marché.👉 Demandez une démo du produit ici.Ce podcast est rendu possible par Modeo.👉 Contactez Matthieu sur son adresse matthieu@modeo.ai ou sur LinkedIn.---📚 RESSOURCES- Le Slack Modern Data Network- Les Meetups Modern Data Stack- La newsletter de DBT The Analytics Engineering Roundup---🧐 AUTRES ÉPISODES#82 - Rivery : l’ETL moderne qui bouscule le marché#45 - Voyage Privé : Migrer vers la Modern Data Stack#20 - Gorgias : Migrer vers la Modern Data Stack---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.