Data Science Deep Dive cover image

Data Science Deep Dive

Latest episodes

undefined
Sep 26, 2024 • 25min

#56: Unsere Bundestagswahl-Prognose: Wer gewinnt die Wahl 2025?

Die Analyse für die Bundestagswahl 2025 wird durch fortschrittliche datenbasierte Modelle vorangetrieben. Ein bayesianischer Ansatz hilft, Unsicherheiten in Wahlprognosen zu erfassen und Biases zu minimieren. Es wird ein neues Koalitionsmodell vorgestellt, das Wahrscheinlichkeiten für mögliche Regierungsbildungen berechnet. Herausforderungen der politischen Hypes und deren Einfluss auf Vorhersagemodelle werden ebenfalls angesprochen. Praktische Anwendungen und Simulationen verdeutlichen die Vorhersagemöglichkeiten auf der zugehörigen Website.
undefined
Sep 16, 2024 • 43min

#55: Alle machen XGBoost, aber was macht eigentlich XGBoost? Mit Matthäus Deutsch

Matthäus Deutsch ist ein Experte für XGBoost, das führende Tool zur Analyse tabularer Daten. Er erläutert, warum XGBoost trotz aufkommender Technologien wie Deep Learning weiterhin die erste Wahl bleibt. Im Gespräch geht es um die Technik des Gradient Boosting und deren Anwendungen in Klassifikation und Regression. Matthäus betont die Bedeutung von Domänenwissen für die erfolgreiche Anwendung von XGBoost und diskutiert auch die Herausforderungen sowie Chancen, die generative KI in der Datenwissenschaft mit sich bringt.
undefined
Aug 29, 2024 • 51min

#54: Modell-Deployment: Wie bringe ich mein Modell in die Produktion?

In dieser Folge dreht sich alles um das erfolgreiche Modell-Deployment. Es werden die Vor- und Nachteile von Online- und Offline-Serving besprochen. Die Rolle von APIs und Sicherheitsaspekte stehen ebenfalls im Mittelpunkt. Außerdem wird FastAPI vorgestellt, ein hilfreiches Tool für die API-Entwicklung. Docker und Kubernetes werden als essentielle Technologien für effizientes Deployment hervorgehoben. Insgesamt gibt es wertvolle Tipps zur Automatisierung und Leistungssteigerung in Produktionsumgebungen.
undefined
Aug 15, 2024 • 1h 13min

#53: Agilität à la carte: Das Agile Fluency Model mit Dr. Wolf-Gideon Bleek

Dr. Wolf-Gideon Bleek ist ein Experte für agile Methoden im Data-Science-Bereich. Er erklärt das Agile Fluency Model und seine vier Stufen, die für die Entwicklung agiler Teams entscheidend sind. Wolf-Gideon hebt die Kommunikation zwischen Beratern und Kunden hervor sowie die Anpassung von Projektprioritäten. Zudem diskutiert er die Herausforderungen bei der Implementierung agiler Praktiken und den notwendigen Kulturwandel in Organisationen. Persönliche Einblicke, wie sein Kindheitstraum in Walt Disney World zu arbeiten, runden das Gespräch ab.
undefined
Aug 1, 2024 • 41min

#52: In-process Datenbanken und das Ende von Big Data

In der Diskussion wird die in-process Datenbank DuckDB vorgestellt, die einen innovativen Ansatz für analytische Abfragen bietet. Es wird thematisiert, dass die Ära von Big Data vorbei ist und wie DuckDB damit zusammenhängt. Der Podcast beleuchtet die Herausforderungen und Chancen im Big Data-Bereich sowie die Bedeutung von Datenqualität und Effizienz. Außerdem wird der Übergang von Big Data zu Smart Data sowie die Relevanz von ETL-Methoden erwähnt, um die Datenanalyse zu optimieren.
undefined
Jul 18, 2024 • 46min

#51: Wer rastet, rostet: Die Rolle von Weiterbildung in Data Science

Data Science entwickelt sich ständig und schnell weiter, was kontinuierliche Weiterbildung unerlässlich macht. In dieser Episode diskutieren wir, wie Arbeitgeber*innen ihre Mitarbeitenden unterstützen können und welche organisatorischen und projektbezogenen Formate sich für uns als effektiv erwiesen haben. Zudem sprechen wir über private Fortbildungsmaßnahmen und geben Tipps zur Auswahl geeigneter Kurse und Konferenzen. ***Links*** Data Culture Podcast von BARC (deutsch): https://barc.com/de/the-data-culture-podcast/ The MLOps Podcast (english): https://podcast.mlops.community/ Practical AI (english): https://changelog.com/practicalai Software Engineering Radio Podcast (english): https://se-radio.net/ Data Engineering Podcast (english): https://www.dataengineeringpodcast.com/ Fragen, Feedback und Themenwünsche gern an podcast@inwt-statistics.de
undefined
Jul 11, 2024 • 2min

Ankündigung: Unser Podcast bekommt einen neuen Namen!

Ab der nächsten Episode ist "In Numbers We Trust - Der Data Science Podcast" Geschichte. Wir benennen unseren Podcast um in "Data Science Deep Dive". Aber keine Sorge, ansonsten wird sich nichts ändern. Auf die nächsten 50 Episoden! Vielen Dank an alle treuen Hörer*innen und herzlich willkommen an alle, die neu dabei sind. Wir sind INWT und wir machen Data Science, von der ersten Idee bis zum fertigen Produkt, und in diesem Podcast sprechen wir darüber. Es ist unser Anspruch, Data Science-Themen tiefgehend zu besprechen und praxisorientiert zu vermitteln. Wir sprechen über alles, was wir spannend finden, mit Leuten, die wir kennen und mögen. Wir freuen uns, wenn ihr auch beim Data Science Deep Dive mit dabei seid! Und wie immer könnt ihr eure Fragen, Anmerkungen und Themenwünsche gern an podcast@inwt-statistics.de schreiben.
undefined
Jul 4, 2024 • 39min

#50: Predictive Analytics mit LLMs: ist GPT3.5 besser als XGBoost?

In diesem Podcast wird die Prognose des Fahrzeugpreises durch GPT3.5 Turbo und XGBoost verglichen. Es wird erklärt, wie LLMs und XGBoost kombiniert werden können und die Verwendung von OpenAI über die API besprochen. Die Diskussion umfasst auch die Umwandlung tabellarischer Features in spezielle Konversationsformate, die Verarbeitung von Daten durch LLMs und den Vergleich von LLMs mit traditionellen ML-Modellen.
undefined
Jun 13, 2024 • 1h 10min

#49: Data Science Projekte richtig managen mit Prof. Dr. Marcel Hebing

Prof. Dr. Marcel Hebing gibt Einblicke in sein neues Buch 'Data Science Management' und diskutiert die optimale Verortung von Data Science Teams, Bedeutung der Unternehmenskultur, Herausforderungen bei der praktischen Umsetzung von Data Science Projekten, organisationale Herausforderungen und Zukunft der künstlichen Intelligenz.
undefined
May 30, 2024 • 1h 2min

#48: Open Source vs. Closed Source: Entwicklungen, Trends und Herausforderungen

Die Sprecher diskutieren die Vor- und Nachteile von Open Source und Closed Source im Data Science Bereich, die Entwicklung von proprietären zu programmatischen Lösungen, Trends bei Betriebssystemen, Herausforderungen bei der Portierung von Excel-Plugins, Datenschutz in Cloud-Plattformen, Erfahrungen mit Premium-Support auf Kundenprojekten und Finanzierung von Open-Source-Projekten.

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!
App store bannerPlay store banner
Get the app