De Dataloog

Emmy Huttenhuis | Eva Bosma | Anouk Dutree | Harm Bodewes | Lex Knape | Walter van der Scheer | Jurjen Helmus

De Dataloog is de Nederlandse podcast over big data, data science, Machine Learning en de datagedreven transformatie. Wij brengen de digitale datagedreven wereld dichtbij in het Nederlands en op een begrijpelijke manier. De Dataloog brengt data scientists, consultants, technologiebedrijven, onderzoekers bij elkaar. Onze uitzendingen bevatten: ronde tafel gesprekken, diepte-interviews, toekomstverkenningen, mini-colleges over machine learning en verhalen van ervaringsdeskundigen. Wij zijn onafhankelijk van welke leverancier dan ook.

Episodes

Mentioned books

Jan 13, 2020 • 51min

DTL-S2A1 -Hoe machine learning de Formule1-kijkervaring versterkt

Send us a textIn de Formule1 nemen 20 coureurs het op 21 verschillende circuits tegen elkaar op. Met snelheden van meer dan 370 kilometer per uur en krachten van meer dan 5G is dit een sport van uitersten. Dat de sport high-tech is, bewijst de hoeveelheid data die er tijdens een race wordt gegenereerd, meer dan 1 miljoen datapunten per seconde. In deze uitzending praten we met Luuk Figdor, data scientist bij het Professional Services team van Amazon Web Services. Sinds het vorige seizoen levert Amazon Web Services met slimme inzichten met machine learning namelijk een bijdrage aan de kijkervaring tijdens de races. En dat is geen eenvoudige klus. Aan de hand van verschillende voorbeelden leer je hoe machine learning modellen meerwaarde geven aan het kijken van een Formule 1 wedstrijd. Met verschillende graphics in beeld maakt AWS tijdens een race de “battles” tussen de coureurs tastbaar. Wat is de kans dat de pitstrategie van de ene coureur beter uitpakt dan de strategie van de ander? Wat is de kans dat een coureur met nieuwere banden toch nog de nummer 1 positie overneemt?De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

Dec 24, 2019 • 25min

DTL - De reflectie op 2019

Send us a textNa een mooi jaar waarin we 78 opnames gedaan hebben, 40,000 downloads en 10,000 luisteraars bereikt hebben blikken Walter Lex en Jurjen terug op 2019. We hebben alle drie onze favoriete clips uit interviews verzameld en delen onze gedachtes hierover. En we kijken vooruit naar wat we in 2020 gaan doen. Kortere uitzendingen, het nieuws als aparte uitzending, series maken en de mini colleges ECHT gaan opnemen. Dank voor het mooie jaar, we wensen jullie een fijne kerst / een goed uiteinde van 2019 en een heel mooi data-rijk 2020De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

Dec 16, 2019 • 47min

DTL044 - Hoe het NLse MonetDB het laatste druppeltje performance uit een database haalt

Send us a textNu serverless en de cloud het nieuwe paradigma lijken te zijn, zou je bijna vergeten dat het optimaliseren van databases op bare metal (on premise) minstens zo belangrijk is. Als het uitvoeren van complexe queries de bottleneck in data science projecten wordt, moet je overwegen om de snelheid van het datawarehouse te verbeteren met een column store database. We hebben het al eens eerder gehad over column store databases zoals Vertica. In deze uitzending staat MonetDB centraal. MonetDB is een spin off van het Centrum voor Wiskunde en Informatica (CWI) en heeft als start up nu een investering van ServiceNow gekregen. Zij zijn in staat om queries 700x (!!) sneller te laten draaien dan traditionele SQL omgevingen. Ook zijn ze in staat om Machine Learning in de database zelf toe te passen, zelfs Tensorflow! Lex Knape en Jurjen Helmus spreken in deze uitzending met Ying (Jenny) Zhang COO en Niels Nes CTO van MonetDB. We praten over column store database technologie, de optimalisatie van snelheid en over hoe het contract met ServiceNow tot stand gekomen is. Lex leek in het begin nog niet zo overtuigd maar de 700x snellere database blijft toch wel even hangen! shownotes en meer info op: https://www.dedataloog.nl/uitzending/dtl-044-hoe-het-nlse-monetdb-het-laatste-druppeltje-performance-uit-een-server-haalt/De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

Dec 9, 2019 • 38min

DTL EGG Conference Special 2 – Eerlijkere Betrouwbaardere en Voorspelbare lokale belastingen met behulp van AI

Send us a textBelasting betalen zal nooit de favoriete activiteit zijn van wie dan ook, maar als burgers willen hebben we wel verlangens van hoe de belastingdienst omgaat met de implementatie van AI. Zeker ook bij lokale belastingen willen we als burgers dat belastingen eerlijk, betrouwbaar, efficient en voorspelbaar zijn zodat de burger en de overheid weet waar zij aan toe is. En als het om de inzet van algoritmes bij de (lokale) overheid gaat, willen we vooral dat dit transparant, eerlijk en met zorg gebeurt. Hoe zet je als Dienst Belastingen van de Gemeente Amsterdam op een verantwoorde en slimme manier artificial intelligence in om belastingen eerlijker, makkelijker en efficiënter te maken? In deze Dataloog gaat Jan Geert Bakker, Directeur Dienst Belastingen bij de Gemeente Amsterdam in op de uitdagingen waarmee je in zo’n proces te maken krijgt en hoe je een dergelijk project vormgeeft. Ook aan tafel zitten Frank de Nijs van Centric en Wouter Kroon van Dataiku die samen met de Dienst Belastingen het onderzoek begeleiden en uitvoeren. Het wordt in het gesprek al snel duidelijk dat een dergelijk project zich niet leent voor een typische experimenteer omgeving. Je kunt niet experimenteren en Jupyter notebooks gebruiken in dit project. Dat kan niet omdat (1) er zoveel belangen en betrokkenen bij zijn dat er een platform voor samenwerking nodig is, (2) omdat alle beslissingen over data en algoritmes vastgelegd moeten worden en (3) omdat de algoritmes uiteindelijk ingebouwd worden in de belasting applicaties (van Centric). Kortom, de gemeente Amsterdam, Centric en Dataiku hebben elkaar gevonden. https://www.dedataloog.nl/blogpost/dtl-egg-conference-special-2-eerlijkere-betrouwbaardere-en-voorspelbare-lokale-belastingen-met-behulp-van-ai/De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

Dec 2, 2019 • 51min

DTL043 - Het Data Science Proces in de praktijk

Send us a textEr wordt we eens gesteld dat Data Science en AI projecten zoveel anders zijn dan al het andere in een organisatie. Het Data Science Proces zou dan ook verschillen van traditionele software engineering processen (agile, waterfall, extreme programming). Toch, zo’n 20 jaar geleden bestond er ook al Knowlegde Based Decision Support Systems (KBDSS) en Cross-industry standard process for data mining (CRISP-DM, 2000). Is het echt zo dat Data Science of AI zoveel anders zijn dan deze methodieken? Of is het oude wijn in nieuwe zakken. Data Science en AI projecten worden ook wel in relatie gebracht met innovatie trajecten en dus met lean startup, pivoting, stage gate processing, business model canvas en het value proposition canvas. Kenmerkend aan innovatie trajecten is dat de uitkomst onzeker is en het proces daarom zowel creatief (divergerend) als stage gate (convergerend) ingericht is. In deze dataloog praten we met Joost de Jonge en Adil Bohoudi van Future Facts over hun ervaring met het data science process. Welke stappen nemen zij en waarom? En als een klant belt voor een mogelijke opdracht, gaan ze dan Agile /lean of CRISP te werk?! Wij willen het weten want de theorie uit de boekjes kennen we nu onderhand wel maar de praktijk nog te weinig.De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

Nov 28, 2019 • 44min

DTL EGG conference special 1- hoe data de Nederlandse roeiers helpt aan de gouden plak tijdens de spelen

Send us a textDat Data en Sport samengaan zal de meeste mensen niet gek in de oren klinken, want ook veel niet prof sporters maken gebruik van apps zoals strava, fitbit, apple watch, Tomtom sports. Ook in de topsport wordt er in steeds grotere mate gebruik gemaakt van data om “betere beslissingen te nemen”. Belangrijke beslissingen zijn de wijze en zwaarte van training en het al of niet opstellen van sporters. Maar in de topsport heb je direct te maken met een veelheid aan rollen om de sporter heen die allen beslissingen maken en data hiervoor gebruiken. De coach stelt een trainingsprogramma samen, de trainer meet hoe een sporter reageert op een training, de medische staf meet hoe de sporter fysiek reageert en de sporter zelf meet zijn geestelijke gesteldheid. Dit spel van rollen, data bronnen, de mens als individu en complexe beslissingen vraagt om een Data Science omgeving waarin dit alles professioneel ingericht kan worden. Het Amsterdam Institute of Sport Science (AISS) heeft in samenwerking met Capgemini, Dataiku, KNZB / KNRB en NOC*NSF het IRIS platform ontwikkeld waarin de rollen, beslissingen en algoritmes samenkomen. IRIS is hiermee dé tool om data uit de topsport op één plek op te slaan en terug te kunnen koppelen aan coaches en atleten. Met behulp van een big data oplossing wordt de data gestructureerd opgeslagen en is het beschikbaar voor multidisciplinair onderzoek. In deze dataloog spreken we met Dennis van Kooij (AISS/ Hogeschool van Amsterdam) Daan Landkroon (Capgemini) en Julian van Velzen (Capgemini) over hoe het IRIS platform opgebouwd is en uiteraard welke betere beslissingen je hiermee kunt nemen.De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

Nov 25, 2019 • 50min

DTL42 – Data Science op volle kracht bij Vattenfall met behulp van de Data Engineers

Send us a textDe B2B energie markt is een typische commodity markt die prijs en duurzaamheid gedreven is. In deze markt kun je alleen maar relevant zijn als je duurzaamheid als uitgangspunt neemt en in staat bent een persoonlijke aanbieding met een gunstige prijs kunt doen aan de klant op basis van een persoonlijk profiel. Dat vereist dat je op basis van (smart) meter data slim energie kunt inkopen en dat je samen met de klant kijkt naar waar energie bespaard kan worden. Vattenfall is in staat om middels Data Science producten samen met klanten uit verschillende sectoren te kijken naar waar energiebesparing kan plaatsvinden. De energie prijs wordt door de APX prijs een dag tevoren per kwartier bepaald. De uitdaging is daarom voor Energie bedrijven als Vattenfall om tezamen met grote energie afnemers data te delen en samen te sturen op het verbruik van energie bij de klant (denk aan uitstellen piek vermogen) zodat samen de voordeligste energie rekening behaald kan worden. Een mooi voorbeeld van slim energie gebruik en ook opwekken vind je bij tuinders. Tuinders kunnen in hun kas zowel energie gebruiken om een kas te verwarmen maar ook opwekken middels hun Warmte Kracht Koppeling (WKK). Door slimme samenwerking tussen tuinder en energie leverancier kan samen een energie strategie bepaald worden. Echter, de echte business waarde wordt pas gecreëerd als deze concepten in productie komen. En daarvoor zijn schaarse Data Engineers nodig! In deze dataloog praten we met Rens Weijers van Manager data en strategie bij Vattenfall en Peter van t Hof Data Engineer bij Godatadriven en werkzaam bij Vattenfall. Beide heren hebben geen achtergrond in data Rens is controller van origine en Peter een Bio-informaticus. We praten in deze uitzending over hoe Vattenfall op dit moment met behulp van Data Science/ AI op het Vattenfall Analyticsl Platform (VAP) in staat is om slimme algoritmes in productie te brengen. Om hier te komen heeft Vattenfall een reis afgelegd van MapR, Hadoop, Cloudera, Scala, Cloud platform tot nu een eigen stack op Microsoft Azure. En ook praten we over Data Engineering keuzes, parquet, flink, elastic, etc. PS: Data Engineers die luisteren en een mooie baan in de energie sector zoeken kunnen met Rens contact opnemen. shownotes op https://www.dedataloog.nl/uitzending/dtl42-data-science-op-volle-kracht-bij-vattenfall-met-behulp-van-de-data-engineers/De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

Nov 21, 2019 • 36min

DTL Godatafest Special 3 – Hoe de Exact mkb monitor online het meest accurate beeld van de Nederlandse economie heeft

Send us a textHoe ontwikkelt de winstgevendheid van Nederlandse bedrijven zich? Is er sprake van omzetgroei of juist een daling? En hoe lang moeten ondernemers gemiddeld wachten op hun geld? Het antwoord op deze vragen geeft de Exact mkb monitor In deze monitor wordt op basis van geanonimiseerde klantdata van 340.000 bedrijven die hun administratie bijhouden in Exact Online een beeld geschetst. Het leuke van deze innovatie is dat het voortkomt uit een interne hackathon van Exact en hierna met de directie als sponsor voortgezet door het data science-team van Exact. De dataspecialisten hebben de cijfers van de afgelopen tien jaar eerst getoetst aan andere openbare cijfers, waaronder die van het Centraal Bureau voor de Statistiek (CBS). Niet alleen is er een mooi resultaat ontwikkeld maar ook heeft Exact veel geleerd over het implementeren van Data Science in de organisatie. En bovenal biedt de gebruikte tools kansen voor nieuwe functionaliteiten voor de eindgebruikers. We spreken tijdens deze uitzending met Marichelle Gietema en Levon Goceryan van Exact over het proces om te komen tot innovatie op basis van Data Science en hun rol als Analytics Translator. Walter heeft als als host de touwtjes in handen en Jurjen gaat als vanouds helemaal los met zijn vragenvuur. Kortom een mooi einde van de specials van Godatafest. zie shownotes op https://www.dedataloog.nl/uitzending/dtl-godatafest-special-3-hoe-de-exact-mkb-monitor-online-het-meest-accurate-beeld-van-de-nederlandse-economie-heeft/De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

Nov 18, 2019 • 51min

DTL041 - Data Science resultaten in productie nemen met het ownR platform

Send us a textData Science en AI belanden in een fase waarin het in productie nemen van resultaten belangrijker wordt dan het doen van experimenten. Er zijn diverse manieren om AI projecten in productie te nemen (i) als rapport, (ii) als dashboard (R-Shiny of PowerBI) of (iii) als API te benaderen door een andere tool. Welke manier er ook gebruikt wordt voor implementatie, een productie omgeving stelt echter andere eisen aan de algoritmes die geschreven worden. Productie betekent: live./ beschikbaar / stabiel / veilig / snel en schaalbaar. Dit is eigenlijk alles wat het draaien op een notebook niet is. Een ideale productie platform (i) kan dan ook omgaan met verschillende versies van Python/R en packages, (ii) is schaalbaar in geheugen en computing power zodat algoritmes blijven draaien, (iii) kan omgaan gebruikers accounts. De standaard platformen waar R of Python op draaien zijn dit niet. Het ownR platform is dit wel. Hoewel we geen reclame willen maken voor een specifiek platform, kunnen we wel veel leren van een uitzending over de eigenschappen van ownR. We praten met David Kun oprichter van Functional Analytics die het ownR platform ontwikkelt. Naast data scientist is David ook nog een expert op het gebied van programmeren in python/R, de wiskunde erachter, en de veranderkundige problemen in organisaties.De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

Nov 13, 2019 • 43min

DTL godatafest Special 2– Hoe Wehkamp in staat is om de hele organisatie toegang te geven tot het Data Science platform met Databricks

Send us a textStel je voor dat in jouw bedrijf de CTO de visie heeft gekregen dat iedere werknemers de mogelijkheid zou moeten hebben om zijn of haar werk op basis van data zelfstandig te kunnen verbeteren. Sterker, de visie is niet alleen dat iedereen dit zelfstandig zou moeten kunnen, maar ook dat werknemers die dit willen dit zelf moeten kunnen programmeren in bijvoorbeeld Python. Wat zou dat betekenen? Wehkamp heeft sinds enkele jaren deze visie omarmd en heeft middels het Databricks platform aan alle werknemers de mogelijkheid gegeven om AI zelf toe te passen in de organisatie. WOW! We praten in deze Dataloog met Arnoud de Munnik Data scientist bij Wehkamp. We praten over hoe databricks ondersteunt bij het uitrollen van Data Science binnen de organisatie, over de use case van ranking algoritmes in de praktijk, over het effect van de digitale transformatie op de rollen binnen de organisatie (software engineer neigt naar data, de data scientist leert software bouwen). We zouden nog uren kunnen doorpraten en wellicht doen we dat een andere keer nog wel! Dank aan Wehkamp voor dit mooie openhartige gesprekDe Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!

App store banner

Play store banner