

DataGen
Robin Conquet
DataGen est un podcast qui permet de comprendre les stratégies data des plus belles boîtes en France. Je m'appelle Robin Conquet et chaque semaine j'invite un expert de la data pour décrypter ses problématiques. BlaBlaCar, Doctolib, Pernod Ricard, Deezer et bien d'autres, dans ce podcast, tu découvriras comment les entreprises qui réussissent utilisent la data. Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
Episodes
Mentioned books

18 snips
Apr 8, 2024 • 39min
#120 - La fin de la Modern Data Stack ? Avec Christophe Blefari (aka Blef)
Christophe Blefari est Staff Data Engineer et auteur de la célèbre newsletter data française Blef.fr. Il est l’un des plus gros experts data en France et est d’ailleurs membre du collectif de freelances DataGen. Il revient nous parler des dernières actualités data, notamment du débat qui échauffe les esprits ces dernières semaines : est-ce la fin de la Modern Data Stack ?On aborde :🔥 Pourquoi parle-t-on de la fin de la Modern Data Stack ?🔥 Ce qu’on observe auprès de l’écosystème français🔥 Le retour de Christophe sur la dernière conférence DuckDB🔥 La “Fast news” de Christophe : SDF, nouvelle alternative à dbt ?---💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Rencontrez-nous ici.---🎬 CHAPITRES00:00 Générique01:27 Intro02:23 Pourquoi parle-t-on de la fin de la Modern Data Stack ?05:41 Retour sur l’adoption massive du concept de Modern Data Stack20:50 Zoom sur l’écosystème Data Stack en France29:46 Nouveauté DuckDB : l'outil sort en version 1 à l'été 202435:12 La Fast news de Blef : SDF, la nouvelle alternative de bdt---📚 RESSOURCES- Fundamentals of Data Engineering de Joe Reis- Les replays du Data Council à Austin 2024 ne sont pas encore sortis. Voici la chaîne YouTube- L’article sur SDF, l’alternative à dbt---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#153 - ClickHouse : Le Real-Time Data Warehouse qui Concurrence les Géants🇬🇧 #106 - Aircall: Adapting the Data Strategy to the slowing economic environment#100 - On décrypte 3 tendances data de 2024 avec Christophe Blefari 🎁#90 - Ovrsea : Mettre en place une approche Self-Service#67 - Les 4 tendances data de 2023 avec Christophe Blefari (Aka Blef.fr)---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Apr 1, 2024 • 28min
#119 - Carrefour : Passer d’un Data Lab à une Analytics Factory
🎁 LIEN VERS LE FORMULAIRE A REMPLIR (3-4 MIN) POUR TENTER DE GAGNER UNE MONTRE FITBIT : https://bit.ly/3uwlqNH 🎁Arnaud Grojean est Chief Data & Analytics Officer Europe chez Carrefour, le leader de la grande distribution en Europe. Ils sont aujourd’hui 150 au sein de l’Analytics Factory. Il est venu nous parler de son plus gros challenge : passer la data à l’échelle via la création d’une Analytics Factory.On aborde :🔥 Son parcours pour devenir Chief Data & Analytics Officer Europe🔥 La phase Data Lab et le passage à l’échelle avec l’Analytics Factory🔥 L’approche adoptée et les objectifs de l’Analytics Factory🔥 Les principaux challenges et les prochaines étapes.---❤️ PARTENAIRECe podcast est rendu possible par DataGalaxy, le Data Catalog utilisé par plus de 150 clients dans le monde (Total, SNCF ou Bank of China aux US).👉 Réservez une demo : https://bit.ly/3P0DQNA. ---🎬 CHAPITRES00:00 Générique01:44 Intro03:45 Le parcours d’Arnaud05:50 Prouver l’impact de la data (Data Lab)08:43 Scaler l’usage de la data (Analytics Factory)11:22 Deux use cases14:42 Les challenges rencontrés : prioriser les projets et s’adapter au marché 19:47 La data victime de son succès chez Carrefour21:58 Les next steps : extension géographique, acculturation data et formations24:56 Les questions de la fin (ressources, conseils...)---📚 RESSOURCESCassie Kozyrkov : son LinkedIn, sa chaîne YouTube et son Medium---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#78 - Air France : Assurer l’adoption des produits data#84 - Veepee : Utiliser les Data Contracts pour scaler sa Data Platform#54 - Pernod Ricard : Lancer des programmes de Data Science---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Mar 27, 2024 • 17min
#118 - Reconversion | Des Ressources Humaines à Data Analyst spécialisée RH
Laura Chane Ching était cheffe de projet RH chez Decathlon et s’est reconvertie vers un rôle de Data Analyst spécialisée RH toujours chez Decathlon (aka People Analytics). On aborde :🔥 Son parcours et les facteurs qui l’ont poussée à se reconvertir dans la data🔥 Le choix de la formation DataBird et le soutien de Decathlon🔥 La transition et ses chantiers au sein du département People Analytics🔥 Ses conseils pour réussir une reconversion en data.---❤️ PARTENAIRECe podcast est rendu possible par DataBird, le bootcamp spécialisé sur la Data.👉 Lien vers leur site internet : bit.ly/47UthCv---🎬 CHAPITRES00:00 Générique00:51 Intro02:35 Qu’est-ce que le People Analytics ?04:49 Le déclic pour se reconvertir05:42 Pourquoi DataBird ?07:07 La transition vers son nouveau poste09:24 Ses nouvelles missions12:09 Les compétences acquises lors de la formation qu’elle utilise au quotidien13:08 Les questions de la fin (ressources, conseils...)---📚 RESSOURCEChatGPT---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#103 - Reconversion | De Responsable Études de Marché à Data Analyst#71 - Lancer sa carrière data avec Kevin Rosamont Prombo#60 - Décathlon : Implémenter une nouvelle stratégie Analytics---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

16 snips
Mar 25, 2024 • 37min
#117 - Masterclass | Tout comprendre sur les IA Génératives avec Benjamin Cohen-Lhyver
Le podcast met en lumière les étapes d'un projet GenAI en entreprise, les différents types de modèles et leurs avantages, la définition des concepts clés tels que les transformers et les RAG, ainsi que les prévisions pour le futur à l'ère de l'intelligence artificielle. Les sujets abordés incluent le cadrage des projets, le choix entre open source et propriétaire, l'industrialisation des projets GenAI, les challenges rencontrés et les perspectives sur le monde de demain.

Mar 20, 2024 • 18min
#116 - Fivetran : L’ETL pilier de la Modern Data Stack
Mabrouk Gadri est Senior Solution Engineer chez Fivetran, l’ETL moderne qui a été adopté par énormément de boites en France et dans le monde, aussi bien des startups que des grands groupes du CAC40.On aborde :🔥 Ce qu’est un ETL Moderne et les différentes solutions du marché🔥 Pourquoi les entreprises choisissent Fivetran ?🔥 L’adoption croissante des ETL modernes par les grands groupes🔥 Comment les IA Génératives impactent ce marché.---❤️ PARTENAIRECe podcast est rendu possible par Fivetran👉 Lien vers leur site internet : https://bit.ly/3Tm34ax---🎬 CHAPITRES00:00 Générique00:55 Intro04:22 Qu’est-ce qu’un ETL moderne ?07:37 Qu’est-ce qui distingue Fivetran des autres solutions ?10:23 L’adoption croissante des ETL modernes par les grands groupes13:13 Quel est l’impact des IA génératives sur ce marché ?15:36 Les questions de la fin (ressources, conseils...)---📚 RESSOURCES- Le Medium Towards Data Science- Le LinkedIn de Mabrouk- Le LinkedIn de Bill Hillman- La chaîne Ternary Data de Joe Reis---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#112 - MyLight Systems : Migrer vers une Modern Data (& AI) Stack avec Databricks#14 - Aircall : Faire scaler l'impact de l'équipe data sur l'entreprise---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Mar 18, 2024 • 31min
#115 - Doctolib : Scaler sa Data Visualisation auprès de 2000 utilisateurs
🎁 LIEN VERS LE FORMULAIRE A REMPLIR (3-4 MIN) POUR TENTER DE GAGNER UNE MONTRE FITBIT : https://bit.ly/3uwlqNH 🎁Lucie Bailly est Data Product Manager chez Doctolib, la licorne française qui propose une plateforme de prise de rendez-vous avec des médecins et qui permet également de faire de la téléconsultation. Elle est présente en France, en Allemagne et en Italie, et est aujourd’hui utilisée par 340 000 personnels de santé et plus de 80 millions de patients.On aborde :🔥 L’organisation Data chez Doctolib et son rôle de Data Product Manager🔥 Son plus gros challenge : déployer Tableau à l’échelle auprès de 2000 utilisateurs🔥 Les étapes clés : audit, POC, implémentation technique, gouvernance, ouverture, run🔥 La difficulté majeure : la phase d’itération nécessaire au moment de l’ouverture de l’outil aux équipes (ex : process, documentation)---❤️ PARTENAIRECe podcast est rendu possible par DataGalaxy, le Data Catalog utilisé par plus de 150 clients dans le monde (Total, SNCF ou Bank of China aux US).👉 Réservez une demo : https://bit.ly/3P0DQNA---🎬 CHAPITRES00:00 Générique01:25 Intro04:33 L'organisation Data chez Doctolib05:45 Les principaux chantiers de Lucie07:07 Son challenge principal : scaler son outil de Data Visualisation09:55 Etape 1 : audit10:58 Etape 2 : POC13:00 Etape 3 : implémentation technique15:13 Etape 4 : ouverture de l'outil aux équipes Data17:16 Etape 5 : run17:47 Sa plus grosse difficulté : l’ouverture aux équipes20:53 Le Data Enablement chez Doctolib22:22 Ses conseils pour scaler sa Data Visualisation24:13 La stack data chez Doctolib24:39 Les prochaines étapes26:46 Les questions de la fin (ressources, conseils...)---📚 RESSOURCEDear Data de Giorgia Lupi---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#97 - Contentsquare : Lancer l’équipe Product Analytics#90 - Ovrsea : Mettre en place une approche Self-Service#11 - Doctolib : Accélérer la mise à disposition des données grâce à une réorganisation---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

8 snips
Mar 4, 2024 • 35min
🇬🇧 #114 - BlaBlaCar : Managing 50 Data People with Manu, VP Data
🎁 LINK TO THE QUESTIONNAIRE TO WIN A FITBIT WATCH: https://bit.ly/3uwlqNH 🎁Emmanuel Martin-Chave is VP Data at BlaBlaCar, the French unicorn who offers several mobility services. I had already welcomed him on the podcast to know more about their data strategy in the episode #13. This time, we talk about management.We cover:🔥 What the Data department looks like today🔥 How to introduce “Middle Managers” (Manu prefers “Front Line Managers”)🔥 How to create a great path for Individual Contributors🔥 Why it’s crucial to anticipate recruitments 3 years in advance when you’re 50 in the team.---❤️ SPONSORThis episode is brought to you by DataGalaxy, the Data Knowledge Catalog used by over 150 companies such as Total, SNCF, and Bank of China in the United States.👉 Request a demo: https://bit.ly/3wxX06Z---🎬 CHAPTERS00:00 Trailer01:45 Intro02:35 What the Data department looks like03:38 Why and how to introduce middle managers?07:51 The importance of having a mix between Individual Contributors (IC) & Managers10:29 The current mix between IC & Managers at BlaBlaCar13:22 The challenges associated with this organization17:11 How to create a great path for IC22:26 Why it’s crucial to anticipate recruitments 3 years in advance when you’re 50 in the team25:13 His main challenges in terms of management29:18 The next steps of the Data team30:34 Last questions (ressources, tips…)---📚 RESSOURCEAn Elegant Puzzle by Will Larson---🧐 OTHER EPISODES YOU SHOULD LOVE🇬🇧 #106 - Aircall: Adapting the Data Strategy to the slowing economic environment🇬🇧 #96 - Deezer : How I restructured the Business Analytics team and made it more Business-Focused#13 - BlaBlaCar : Fournir de la donnée et des algorithmes à l'entreprise---💪 GOT A DATA PROJECT?DataGen is also a collective of data freelancers from top companies (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... We have the team that you need!👉 Meet us---🎙 SUPPORT THE PODCAST FOR FREE1/ Subscribe 🔔2/ Leave a 5 stars review on Apple Podcasts here 🥰 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Feb 28, 2024 • 16min
#113 - Inclusion In Data | Créer des Role Models et un réseau de Soutien pour les femmes de la Tech
Marie Sacksick est Head of Data chez CybelAngel et co-organisatrice des meetups WiMLDS (Women in Machine Learning and Data Science), la communauté mondiale regroupant les femmes passionnées par le Machine Learning et la Data Science.On aborde :🔥 Pourquoi créer Women in Machine Learning and Data Science (WiMLDS) ?🔥 Les objectifs et les challenges de ces meetups : créer des role models et un réseau de soutien et d'expertise🔥 Leur organisation et leurs actions aux quotidien (talks croisés, articles…)🔥 Leur plus grosse réussite : attirer autant de femmes que d’hommes.---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---🎬 CHAPITRES00:00 Générique01:03 Intro04:41 Pourquoi créer WiMLDS ?06:07 Leurs objectifs08:12 Leurs challenges09:13 L’organisation des meetups11:54 Leurs réussites13:29 Leurs next steps14:35 Le conseil de Marie---📚 RESSOURCES- Le LinkedIn de Marie- Le LinkedIn de Clara- Les meetups WiMLDS---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#107 - Inclusion In Data | Leader le collectif Women@Google avec Taline Mouradian#88 - Inclusion In Data | Créer une équipe inclusive avec Sébastien Garcin#61 - Inclusion In Data | Le management au féminin et les quotas avec Christelle Marfaing---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

10 snips
Feb 26, 2024 • 28min
#112 - MyLight Systems : Migrer vers une Modern Data (& AI) Stack avec Databricks
🎁 LIEN VERS LE FORMULAIRE A REMPLIR (3-4 MIN) POUR TENTER DE GAGNER UNE MONTRE FITBIT : https://bit.ly/3uwlqNH 🎁Loïc Magnien est Head of Data chez MyLight Systems, la scale up pionnaire de l’autoconsommation solaire qui permet aux particuliers et aux entreprises de faire des économies d'énergie. Ils ont levé 100 millions d’euros en 2023 et Loïc revient sur son plus gros challenge de ces dernières années : migrer vers une Modern Data (& AI) Stack.On aborde :🔥 Le contexte chez MyLight Systems avant de migrer vers la Modern Data (& AI) Stack🔥 Les 3 étapes clefs de la migration : état des lieux, POC et industrialisation🔥 La plus grosse difficulté de Loïc : continuer de servir le Business🔥 La stack data et l'organisation des équipes.---❤️ PARTENAIRECe podcast est rendu possible par DataGalaxy, le Data Catalog utilisé par plus de 150 clients dans le monde (Total, SNCF ou Bank of China aux US).👉 Réservez une demo : https://bit.ly/3P0DQNA---🎬 CHAPITRES00:00 Générique01:38 Intro06:55 Les grandes étapes clés07:39 Etape 1 : le POC11:58 Etape 2 : Documentation13:07 Etape 3 : Rationnalisation des rapports15:36 Focus sur DBT17:06 Le plus gros challenge de Loïc pendant sa migration : continuer à servir le Business19:44 La stack data20:33 Focus sur Databricks22:46 L'orga des équipes23:34 Leurs next steps24:41 Les questions de la fin (ressources, conseils...)---📚 RESSOURCES- Scaling People de Claire Johnson- Futureproof: 9 Rules for Humans in the Age of Automation de Kevin Roose---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#102 - Databricks : Une stack unique pour l’Analytics et l’IA#90 - Ovrsea : Mettre en place une approche Self-Service#85 - Masterclass | Comprendre la Modern Data Stack---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

6 snips
Feb 21, 2024 • 27min
#111 - DataGalaxy : Mettre en place un Data Catalog
🎁 LIEN VERS LE FORMULAIRE A REMPLIR (3-4 MIN) POUR TENTER DE GAGNER UNE MONTRE FITBIT : https://bit.ly/3uwlqNH 🎁Sébastien Thomas est co-fondateur et CEO de DataGalaxy, le Data Catalog qui est utilisé par plus de 150 clients dans le monde tels que Total, SNCF, Swiss Life ou Bank of China aux US. Il nous fait une masterclass sur la mise en place d’un Data Catalog.On aborde :🔥 Qu’est-ce qu’un Data Catalog et dans quel contexte c’est nécessaire ?🔥 L’importance du sponsorship et la bonne méthode : procéder par use case et par itération🔥 Les phases clés : collecter ses métadonnées, compléter le glossaire…🔥 Le marché du Data Catalog et les différentes solutions.---❤️ PARTENAIRECe podcast est rendu possible par DataGalaxy.👉 Réservez une demo : https://bit.ly/3P0DQNA---🎬 CHAPITRES00:00 Générique00:55 Introduction01:27 Le parcours de Sébastien02:32 Qu’est-ce qu’un Data Catalog ?04:25 Dans quel contexte c’est utile05:56 A partir de quelle taille d'entreprise ?06:37 Les différentes étapes10:43 Les écueils à éviter12:24 Les fonctionnalités d'un Data Catalog17:52 Les utilisateurs du Data Catalog20:15 Les différentes solutions sur le marché22:30 Les ressources recommandées par Sébastien24:36 Ce qu'il aime dans la data24:58 Ce qui l’a le plus fait progresser25:41 Le meilleur conseil qu’on lui ait donné---📚 RESSOURCES- Brent Dykes (sa page LinkedIn, son livre)- Chat Sanderson- Data Model Storytelling de Larry Burns- La chaîne Youtube Science Etonnante---🧐 AUTRES ÉPISODES#102 - Databricks : Une stack unique pour l’Analytics et l’IA#90 - Ovrsea : Mettre en place une approche Self-Service#77 - Sunday : Scaler grâce à une orga Data Mesh---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.