Engineering Kiosk

#248 Data as a Product: Die Struktur & Skalierung von Data-Teams mit Mario Müller von Veeva

Dec 30, 2025
Mario Müller, Director of Data Engineering bei Veeva Systems, erklärt, wie aus Rohdaten verkaufbare Datenprodukte werden. Er diskutiert die Strukturen von Datenteams und die Eigenverantwortung bei Daten. Zudem geht er auf Technologien wie Delta und AWS S3 ein und begründet die Entscheidung für Batch- statt Streaming-Processing. Interessant ist auch seine Sicht auf die Rolle der KI im Datenmanagement und die Notwendigkeit menschlicher Qualitätskontrolle. Mario gibt schließlich wertvolle Ratschläge für den Aufbau einer robusten Datenorganisation.
Ask episode
AI Snips
Chapters
Transcript
Episode notes
INSIGHT

Daten Sind Das Produkt

  • Datenteams liefern primär Daten als Produkt und besitzen Ownership über Datenqualität und Taxonomien.
  • Das unterscheidet sie von transaktionalen Teams, deren Daten Nebenprodukt von Benutzeraktionen sind.
ADVICE

Frühes Mapping Auf Gemeinsame Business-Entitäten

  • Lege früh ein internes Business-Entity-Mapping fest, damit nachgelagerte Teams dieselbe Semantik nutzen.
  • Vermeide wiederholte Transformationslogik in mehreren Teams durch klares Mapping.
INSIGHT

Batch Ist Oft Genug

  • Batch-Processing kann praktisch und skalierbar sein; Streaming bringt zusätzliche Komplexität.
  • Mario bevorzugt inkrementelle Batch-Läufe, wenn Near‑Realtime nicht nötig ist.
Get the Snipd Podcast app to discover more snips from this episode
Get the app