Data Science Deep Dive cover image

Data Science Deep Dive

Latest episodes

undefined
Feb 2, 2023 • 47min

#17: Use Case - Kundensegmentierung

Im Online Marketing und Customer Relation Management kann man nicht alle Kund*innen über einen Kamm scheren, aber sich auch nicht um jede Kund*in individuell kümmern. Der goldene Mittelweg ist die Kundensegmentierung, über die wir in dieser Episode ausführlich sprechen. Sie erlaubt eine optimale Aussteuerung von Werbemitteln und zeitlichen Ressourcen während Kund*innen gezielt und bedürfnisgerecht adressiert werden können. Links: Business Case Kundensegmentierung: https://www.inwt-statistics.de/business-cases/kundensegmentierung.html White Paper Download https://www.inwt-statistics.de/business-cases/kundensegmentierung.html?file=files/INWT/downloads/white_paper/INWT_White_Paper_Kundensegmentierung.pdf
undefined
Jan 19, 2023 • 31min

#16: Sind Daten das neue Öl?

In dieser Episode diskutieren wir einen Artikel von Dr. Paul von Bünau und Dr. Sven Jungmann im Tagesspiegel Background mit dem Titel "Daten sind nicht das neue Öl". Wir greifen die Argumente des Artikels auf und zeigen unsere Sicht auf die vorgestellten Punkte. Link zum Artikel: https://background.tagesspiegel.de/gesundheit/daten-sind-nicht-das-neue-oel
undefined
Jan 5, 2023 • 49min

#15: Data Science Architektur: Microservices vs. Data Mesh

In dieser Episode beschäftigt uns die Frage, wie eine optimale Service-Architektur für Daten-Produkte aussehen kann. Wir vergleichen Microservices mit dem neuen Trend hin zu einem Architekturstil, der auf der Data Mesh Organisationsform beruht ("Data Services"). Links: Definition Microservice: https://martinfowler.com/articles/microservices.html Beispiel Microservice: https://microservices.io/patterns/microservices.html Data Mesh – Original Artikel: https://martinfowler.com/articles/data-mesh-principles.html Data Mesh - Architektur Chart: https://www.datamesh-architecture.com/#how-to-design-a-data-mesh "Microservices" video by KRAZAM: https://www.youtube.com/watch?v=y8OnoxKotPQ
undefined
Dec 22, 2022 • 44min

#14: Kubernetes

Kubernetes ist ein Open-Source-System, das für die Verwaltung und Bereitstellung von containerisierten Anwendungen verwendet wird. In dieser Episode besprechen wir, wie Data Scientists Kubernetes nutzen können, um ihre Arbeitsabläufe zu optimieren, ihre Projekte skalierbar & zuverlässig zu machen und wie Kubernetes speziell unseren Arbeitsalltag verändert hat. Links: Die Welt der Container: Einführung in Docker
undefined
Dec 8, 2022 • 38min

#13: Datenqualität

"Garbage In, Garbage Out" hat auch in der Data Science Praxis eine hohe Relevanz: ein Modell kann nur so gut sein, wie die Daten auf denen es basiert. In dieser Episode sprechen wir darüber, wie Probleme mit der Datenqualität aufgedeckt werden können und welche Strategien es gibt, um Datenqualität in Projekten konsequent sicherzustellen. Links: https://www.inwt-statistics.de/blog-artikel-lesen/Datenqualitaet.html
undefined
Nov 24, 2022 • 31min

#12: Use Case - Luftschadstoffprognose für Berlin

In dieser Episode berichten wir über ein aktuelles Projekt für die Senatsverwaltung für Umwelt, Mobilität, Verbraucher- und Klimaschutz (SenUMVK). Hierbei geht es um die Vorhersage der Luftschadstoffbelastung (NO2, PM2.5, PM10) in Berlin. Auf einem 50 x 50m Raster über Berlin erstellen wir für jede Zelle stündliche Prognosen für jeden der 3 Schadstoffe. Wir erzählen euch etwas über die zugrunde liegenden Daten und den Modellierungsansatz und berichten über Lessons Learned in diesem Projekt. Artikel auf der Seite des übergeordneten eUVM-Projektes: https://testfeldstadtverkehr.berlin/prognose-von-luftschadstoffen-in-berlin/
undefined
Nov 10, 2022 • 42min

#11: Real Time Analytics

Bei vielen Unternehmen fallen Daten bereits in Echtzeit in der Datenbank an, aber Real Time Analytics ist noch die Ausnahme. Was genau bedeutet Real Time Analytics und was für Implikationen hat es auf die Architektur? Lohnt es sich Real Time Analytics zu implementieren? Links: Emerging Architectures for Real-Time Analytics in Applications: https://softwareengineeringdaily.com/2021/06/15/emerging-architectures-for-real-time-analytics-in-applications/ How Uber scaled its Real Time Infrastructure to Trillion events per day: https://www.youtube.com/watch?v=K-fI2BeTLkk
undefined
Oct 27, 2022 • 28min

#10: Signifikanz

Das Thema der Signifikanz ist ein - wenn nicht der - Grundbaustein der Statistik. In dieser Episode widmen wir uns dem Konzept dieses statistischen Standard-Werkzeugs und klären vor allem welche Rolle Signifikanz im Bereich Data Science und Machine Learning spielt. Links: Silver, N. (2012). The Signal and the Noise: Why So Many Predictions Fail-but Some Don't. USA: Penguin Publishing Group.
undefined
Sep 15, 2022 • 56min

#9: Data Science Project Ownership

Wie managt man ein Data Science Projekt richtig? Natürlich braucht es auch in einem Data Science Projekt Führung und Koordination. Wir erklären das Konzept von Project Ownership und wie unser nicht ganz so einfacher Weg dorthin aussah. Besonders beschäftigt hat uns hier die Frage, wer eigentlich gut als Project Owner geeignet ist. Sollte es ein Data Scientist sein oder eine reine Führungskraft? Und was sind die Aufgaben und Herausforderungen eines Project Owners?
undefined
Sep 1, 2022 • 46min

#8: Use Case - Customer Lifetime Value (CLV)

Der Customer Lifetime Value (CLV) ist eine bekannte Kennzahl im Bereich Online Marketing. Wir schauen hinter die Kulissen und zeigen wie wir ein CLV-Projekt umsetzen und was das eigentlich mit Data Science zu tun hat. Was genau misst der CLV, wie wird er berechnet und was ist zu beachten? White Paper zum Thema Customer Lifetime Value (CLV): Download: Der Kundenlebenswert als zentrale Kennzahl für die unternehmensseitige Aussteuerung der Kundenbeziehung

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!
App store bannerPlay store banner
Get the app