
Data Science Deep Dive
Wir machen Data Science. Und in unserem Podcast Data Science Deep Dive reden wir darüber.
Du bist ebenfalls Data Scientist oder interessierst dich für Daten, ML und AI? Dann ist dieser Podcast für dich. Wir teilen unsere Learnings aus über 180 Projekten, du bekommst Infos und Anregungen zu spannenden Themen rund um Daten.
Wir klären auf, geben Hinweise und teilen unsere Erfahrungen, die wir in über 10 Jahren als Data Scientists im B2B Bereich gesammelt haben.
Wir decken auf, was wirklich hinter den Hypes und Trends der Data Science Branche steckt.
Wir hinterfragen, was ein Data Science Projekt erfolgreich macht und welche Faktoren es zum Scheitern verurteilen.
Latest episodes

Feb 2, 2023 • 47min
#17: Use Case - Kundensegmentierung
Im Online Marketing und Customer Relation Management kann man nicht alle Kund*innen über einen Kamm scheren, aber sich auch nicht um jede Kund*in individuell kümmern. Der goldene Mittelweg ist die Kundensegmentierung, über die wir in dieser Episode ausführlich sprechen. Sie erlaubt eine optimale Aussteuerung von Werbemitteln und zeitlichen Ressourcen während Kund*innen gezielt und bedürfnisgerecht adressiert werden können.
Links:
Business Case Kundensegmentierung: https://www.inwt-statistics.de/business-cases/kundensegmentierung.html
White Paper Download https://www.inwt-statistics.de/business-cases/kundensegmentierung.html?file=files/INWT/downloads/white_paper/INWT_White_Paper_Kundensegmentierung.pdf

Jan 19, 2023 • 31min
#16: Sind Daten das neue Öl?
In dieser Episode diskutieren wir einen Artikel von Dr. Paul von Bünau und Dr. Sven Jungmann im Tagesspiegel Background mit dem Titel "Daten sind nicht das neue Öl". Wir greifen die Argumente des Artikels auf und zeigen unsere Sicht auf die vorgestellten Punkte.
Link zum Artikel: https://background.tagesspiegel.de/gesundheit/daten-sind-nicht-das-neue-oel

Jan 5, 2023 • 49min
#15: Data Science Architektur: Microservices vs. Data Mesh
In dieser Episode beschäftigt uns die Frage, wie eine optimale Service-Architektur für Daten-Produkte aussehen kann. Wir vergleichen Microservices mit dem neuen Trend hin zu einem Architekturstil, der auf der Data Mesh Organisationsform beruht ("Data Services").
Links:
Definition Microservice: https://martinfowler.com/articles/microservices.html
Beispiel Microservice: https://microservices.io/patterns/microservices.html
Data Mesh – Original Artikel: https://martinfowler.com/articles/data-mesh-principles.html
Data Mesh - Architektur Chart: https://www.datamesh-architecture.com/#how-to-design-a-data-mesh
"Microservices" video by KRAZAM: https://www.youtube.com/watch?v=y8OnoxKotPQ

Dec 22, 2022 • 44min
#14: Kubernetes
Kubernetes ist ein Open-Source-System, das für die Verwaltung und Bereitstellung von containerisierten Anwendungen verwendet wird. In dieser Episode besprechen wir, wie Data Scientists Kubernetes nutzen können, um ihre Arbeitsabläufe zu optimieren, ihre Projekte skalierbar & zuverlässig zu machen und wie Kubernetes speziell unseren Arbeitsalltag verändert hat.
Links:
Die Welt der Container: Einführung in Docker

Dec 8, 2022 • 38min
#13: Datenqualität
"Garbage In, Garbage Out" hat auch in der Data Science Praxis eine hohe Relevanz: ein Modell kann nur so gut sein, wie die Daten auf denen es basiert. In dieser Episode sprechen wir darüber, wie Probleme mit der Datenqualität aufgedeckt werden können und welche Strategien es gibt, um Datenqualität in Projekten konsequent sicherzustellen.
Links:
https://www.inwt-statistics.de/blog-artikel-lesen/Datenqualitaet.html

Nov 24, 2022 • 31min
#12: Use Case - Luftschadstoffprognose für Berlin
In dieser Episode berichten wir über ein aktuelles Projekt für die Senatsverwaltung für Umwelt, Mobilität, Verbraucher- und Klimaschutz (SenUMVK). Hierbei geht es um die Vorhersage der Luftschadstoffbelastung (NO2, PM2.5, PM10) in Berlin. Auf einem 50 x 50m Raster über Berlin erstellen wir für jede Zelle stündliche Prognosen für jeden der 3 Schadstoffe. Wir erzählen euch etwas über die zugrunde liegenden Daten und den Modellierungsansatz und berichten über Lessons Learned in diesem Projekt.
Artikel auf der Seite des übergeordneten eUVM-Projektes:
https://testfeldstadtverkehr.berlin/prognose-von-luftschadstoffen-in-berlin/

Nov 10, 2022 • 42min
#11: Real Time Analytics
Bei vielen Unternehmen fallen Daten bereits in Echtzeit in der Datenbank an, aber Real Time Analytics ist noch die Ausnahme. Was genau bedeutet Real Time Analytics und was für Implikationen hat es auf die Architektur? Lohnt es sich Real Time Analytics zu implementieren?
Links:
Emerging Architectures for Real-Time Analytics in Applications: https://softwareengineeringdaily.com/2021/06/15/emerging-architectures-for-real-time-analytics-in-applications/
How Uber scaled its Real Time Infrastructure to Trillion events per day: https://www.youtube.com/watch?v=K-fI2BeTLkk

Oct 27, 2022 • 28min
#10: Signifikanz
Das Thema der Signifikanz ist ein - wenn nicht der - Grundbaustein der Statistik. In dieser Episode widmen wir uns dem Konzept dieses statistischen Standard-Werkzeugs und klären vor allem welche Rolle Signifikanz im Bereich Data Science und Machine Learning spielt.
Links:
Silver, N. (2012). The Signal and the Noise: Why So Many Predictions Fail-but Some Don't. USA: Penguin Publishing Group.

Sep 15, 2022 • 56min
#9: Data Science Project Ownership
Wie managt man ein Data Science Projekt richtig? Natürlich braucht es auch in einem Data Science Projekt Führung und Koordination. Wir erklären das Konzept von Project Ownership und wie unser nicht ganz so einfacher Weg dorthin aussah. Besonders beschäftigt hat uns hier die Frage, wer eigentlich gut als Project Owner geeignet ist. Sollte es ein Data Scientist sein oder eine reine Führungskraft? Und was sind die Aufgaben und Herausforderungen eines Project Owners?

Sep 1, 2022 • 46min
#8: Use Case - Customer Lifetime Value (CLV)
Der Customer Lifetime Value (CLV) ist eine bekannte Kennzahl im Bereich Online Marketing. Wir schauen hinter die Kulissen und zeigen wie wir ein CLV-Projekt umsetzen und was das eigentlich mit Data Science zu tun hat. Was genau misst der CLV, wie wird er berechnet und was ist zu beachten?
White Paper zum Thema Customer Lifetime Value (CLV):
Download: Der Kundenlebenswert als zentrale Kennzahl für die unternehmensseitige Aussteuerung der Kundenbeziehung