
Data Science Deep Dive
Wir machen Data Science. Und in unserem Podcast Data Science Deep Dive reden wir darüber.
Du bist ebenfalls Data Scientist oder interessierst dich für Daten, ML und AI? Dann ist dieser Podcast für dich. Wir teilen unsere Learnings aus über 180 Projekten, du bekommst Infos und Anregungen zu spannenden Themen rund um Daten.
Wir klären auf, geben Hinweise und teilen unsere Erfahrungen, die wir in über 10 Jahren als Data Scientists im B2B Bereich gesammelt haben.
Wir decken auf, was wirklich hinter den Hypes und Trends der Data Science Branche steckt.
Wir hinterfragen, was ein Data Science Projekt erfolgreich macht und welche Faktoren es zum Scheitern verurteilen.
Latest episodes

Sep 26, 2024 • 25min
#56: Unsere Bundestagswahl-Prognose: Wer gewinnt die Wahl 2025?
Die Analyse für die Bundestagswahl 2025 wird durch fortschrittliche datenbasierte Modelle vorangetrieben. Ein bayesianischer Ansatz hilft, Unsicherheiten in Wahlprognosen zu erfassen und Biases zu minimieren. Es wird ein neues Koalitionsmodell vorgestellt, das Wahrscheinlichkeiten für mögliche Regierungsbildungen berechnet. Herausforderungen der politischen Hypes und deren Einfluss auf Vorhersagemodelle werden ebenfalls angesprochen. Praktische Anwendungen und Simulationen verdeutlichen die Vorhersagemöglichkeiten auf der zugehörigen Website.

Sep 16, 2024 • 43min
#55: Alle machen XGBoost, aber was macht eigentlich XGBoost? Mit Matthäus Deutsch
Matthäus Deutsch ist ein Experte für XGBoost, das führende Tool zur Analyse tabularer Daten. Er erläutert, warum XGBoost trotz aufkommender Technologien wie Deep Learning weiterhin die erste Wahl bleibt. Im Gespräch geht es um die Technik des Gradient Boosting und deren Anwendungen in Klassifikation und Regression. Matthäus betont die Bedeutung von Domänenwissen für die erfolgreiche Anwendung von XGBoost und diskutiert auch die Herausforderungen sowie Chancen, die generative KI in der Datenwissenschaft mit sich bringt.

Aug 29, 2024 • 51min
#54: Modell-Deployment: Wie bringe ich mein Modell in die Produktion?
In dieser Folge dreht sich alles um das erfolgreiche Modell-Deployment. Es werden die Vor- und Nachteile von Online- und Offline-Serving besprochen. Die Rolle von APIs und Sicherheitsaspekte stehen ebenfalls im Mittelpunkt. Außerdem wird FastAPI vorgestellt, ein hilfreiches Tool für die API-Entwicklung. Docker und Kubernetes werden als essentielle Technologien für effizientes Deployment hervorgehoben. Insgesamt gibt es wertvolle Tipps zur Automatisierung und Leistungssteigerung in Produktionsumgebungen.

Aug 15, 2024 • 1h 13min
#53: Agilität à la carte: Das Agile Fluency Model mit Dr. Wolf-Gideon Bleek
Dr. Wolf-Gideon Bleek ist ein Experte für agile Methoden im Data-Science-Bereich. Er erklärt das Agile Fluency Model und seine vier Stufen, die für die Entwicklung agiler Teams entscheidend sind. Wolf-Gideon hebt die Kommunikation zwischen Beratern und Kunden hervor sowie die Anpassung von Projektprioritäten. Zudem diskutiert er die Herausforderungen bei der Implementierung agiler Praktiken und den notwendigen Kulturwandel in Organisationen. Persönliche Einblicke, wie sein Kindheitstraum in Walt Disney World zu arbeiten, runden das Gespräch ab.

Aug 1, 2024 • 41min
#52: In-process Datenbanken und das Ende von Big Data
In der Diskussion wird die in-process Datenbank DuckDB vorgestellt, die einen innovativen Ansatz für analytische Abfragen bietet. Es wird thematisiert, dass die Ära von Big Data vorbei ist und wie DuckDB damit zusammenhängt. Der Podcast beleuchtet die Herausforderungen und Chancen im Big Data-Bereich sowie die Bedeutung von Datenqualität und Effizienz. Außerdem wird der Übergang von Big Data zu Smart Data sowie die Relevanz von ETL-Methoden erwähnt, um die Datenanalyse zu optimieren.

Jul 18, 2024 • 46min
#51: Wer rastet, rostet: Die Rolle von Weiterbildung in Data Science
Data Science entwickelt sich ständig und schnell weiter, was kontinuierliche Weiterbildung unerlässlich macht. In dieser Episode diskutieren wir, wie Arbeitgeber*innen ihre Mitarbeitenden unterstützen können und welche organisatorischen und projektbezogenen Formate sich für uns als effektiv erwiesen haben. Zudem sprechen wir über private Fortbildungsmaßnahmen und geben Tipps zur Auswahl geeigneter Kurse und Konferenzen.
***Links***
Data Culture Podcast von BARC (deutsch): https://barc.com/de/the-data-culture-podcast/
The MLOps Podcast (english): https://podcast.mlops.community/
Practical AI (english): https://changelog.com/practicalai
Software Engineering Radio Podcast (english): https://se-radio.net/
Data Engineering Podcast (english): https://www.dataengineeringpodcast.com/
Fragen, Feedback und Themenwünsche gern an podcast@inwt-statistics.de

Jul 11, 2024 • 2min
Ankündigung: Unser Podcast bekommt einen neuen Namen!
Ab der nächsten Episode ist "In Numbers We Trust - Der Data Science Podcast" Geschichte. Wir benennen unseren Podcast um in "Data Science Deep Dive". Aber keine Sorge, ansonsten wird sich nichts ändern. Auf die nächsten 50 Episoden!
Vielen Dank an alle treuen Hörer*innen und herzlich willkommen an alle, die neu dabei sind.
Wir sind INWT und wir machen Data Science, von der ersten Idee bis zum fertigen Produkt, und in diesem Podcast sprechen wir darüber. Es ist unser Anspruch, Data Science-Themen tiefgehend zu besprechen und praxisorientiert zu vermitteln. Wir sprechen über alles, was wir spannend finden, mit Leuten, die wir kennen und mögen.
Wir freuen uns, wenn ihr auch beim Data Science Deep Dive mit dabei seid!
Und wie immer könnt ihr eure Fragen, Anmerkungen und Themenwünsche gern an podcast@inwt-statistics.de schreiben.

Jul 4, 2024 • 39min
#50: Predictive Analytics mit LLMs: ist GPT3.5 besser als XGBoost?
In diesem Podcast wird die Prognose des Fahrzeugpreises durch GPT3.5 Turbo und XGBoost verglichen. Es wird erklärt, wie LLMs und XGBoost kombiniert werden können und die Verwendung von OpenAI über die API besprochen. Die Diskussion umfasst auch die Umwandlung tabellarischer Features in spezielle Konversationsformate, die Verarbeitung von Daten durch LLMs und den Vergleich von LLMs mit traditionellen ML-Modellen.

Jun 13, 2024 • 1h 10min
#49: Data Science Projekte richtig managen mit Prof. Dr. Marcel Hebing
Prof. Dr. Marcel Hebing gibt Einblicke in sein neues Buch 'Data Science Management' und diskutiert die optimale Verortung von Data Science Teams, Bedeutung der Unternehmenskultur, Herausforderungen bei der praktischen Umsetzung von Data Science Projekten, organisationale Herausforderungen und Zukunft der künstlichen Intelligenz.

May 30, 2024 • 1h 2min
#48: Open Source vs. Closed Source: Entwicklungen, Trends und Herausforderungen
Die Sprecher diskutieren die Vor- und Nachteile von Open Source und Closed Source im Data Science Bereich, die Entwicklung von proprietären zu programmatischen Lösungen, Trends bei Betriebssystemen, Herausforderungen bei der Portierung von Excel-Plugins, Datenschutz in Cloud-Plattformen, Erfahrungen mit Premium-Support auf Kundenprojekten und Finanzierung von Open-Source-Projekten.