De Dataloog cover image

De Dataloog

Latest episodes

undefined
Dec 2, 2019 • 51min

DTL043 - Het Data Science Proces in de praktijk

Send us a textEr wordt we eens gesteld dat Data Science en AI projecten zoveel anders zijn dan al het andere in een organisatie. Het Data Science Proces zou dan ook verschillen van traditionele software engineering processen (agile, waterfall, extreme programming). Toch, zo’n 20 jaar geleden bestond er ook al Knowlegde Based Decision Support Systems (KBDSS) en Cross-industry standard process for data mining (CRISP-DM, 2000). Is het echt zo dat Data Science of AI zoveel anders zijn dan deze methodieken? Of is het oude wijn in nieuwe zakken.     Data Science en AI projecten worden ook wel in relatie gebracht met innovatie trajecten en dus met lean startup, pivoting, stage gate processing, business model canvas en het value proposition canvas. Kenmerkend aan innovatie trajecten is dat de uitkomst onzeker is en het proces daarom zowel creatief (divergerend) als stage gate (convergerend) ingericht is.   In deze dataloog praten we met Joost de Jonge en Adil Bohoudi van Future Facts over hun ervaring met het data science process. Welke stappen nemen zij en waarom? En als een klant belt voor een mogelijke opdracht, gaan ze dan Agile /lean of CRISP te werk?! Wij willen het weten want de theorie uit de boekjes kennen we nu onderhand wel maar de praktijk nog te weinig.De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.
undefined
Nov 28, 2019 • 44min

DTL EGG conference special 1- hoe data de Nederlandse roeiers helpt aan de gouden plak tijdens de spelen

Send us a textDat Data en Sport samengaan zal de meeste mensen niet gek in de oren klinken, want ook veel niet prof sporters maken gebruik van apps zoals strava, fitbit, apple watch, Tomtom sports. Ook in de topsport wordt er in steeds grotere mate gebruik gemaakt van data om “betere beslissingen te nemen”. Belangrijke beslissingen zijn de wijze en zwaarte van training en het al of niet opstellen van sporters. Maar in de topsport heb je direct te maken met een veelheid aan rollen om de sporter heen die allen beslissingen maken en data hiervoor gebruiken. De coach stelt een trainingsprogramma samen, de trainer meet hoe een sporter reageert op een training, de medische staf meet hoe de sporter fysiek reageert en de sporter zelf meet zijn geestelijke gesteldheid. Dit spel van rollen, data bronnen, de mens als individu en complexe beslissingen vraagt om een Data Science omgeving waarin dit alles professioneel ingericht kan worden. Het Amsterdam Institute of Sport Science (AISS) heeft in samenwerking met Capgemini, Dataiku, KNZB / KNRB en NOC*NSF het IRIS platform ontwikkeld waarin de rollen, beslissingen en algoritmes samenkomen. IRIS is hiermee dé tool om data uit de topsport op één plek op te slaan en terug te kunnen koppelen aan coaches en atleten. Met behulp van een big data oplossing wordt de data gestructureerd opgeslagen en is het beschikbaar voor multidisciplinair onderzoek. In deze dataloog spreken we met Dennis van Kooij (AISS/ Hogeschool van Amsterdam) Daan Landkroon (Capgemini) en Julian van Velzen (Capgemini) over hoe het IRIS platform opgebouwd is en uiteraard welke betere beslissingen je hiermee kunt nemen.De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.
undefined
Nov 25, 2019 • 50min

DTL42 – Data Science op volle kracht bij Vattenfall met behulp van de Data Engineers

Send us a textDe B2B energie markt is een typische commodity markt die prijs en duurzaamheid gedreven is. In deze markt kun je alleen maar relevant zijn als je duurzaamheid als uitgangspunt neemt en in staat bent een persoonlijke aanbieding met een gunstige prijs kunt doen aan de klant op basis van een persoonlijk profiel. Dat vereist dat je op basis van (smart) meter data slim energie kunt inkopen en dat je samen met de klant kijkt naar waar energie bespaard kan worden. Vattenfall is in staat om middels Data Science producten samen met klanten uit verschillende sectoren te kijken naar waar energiebesparing kan plaatsvinden. De energie prijs wordt door de APX prijs een dag tevoren per kwartier bepaald. De uitdaging is daarom voor Energie bedrijven als Vattenfall om tezamen met grote energie afnemers data te delen en samen te sturen op het verbruik van energie bij de klant (denk aan uitstellen piek vermogen) zodat samen de voordeligste energie rekening behaald kan worden. Een mooi voorbeeld van slim energie gebruik en ook opwekken vind je bij tuinders. Tuinders kunnen in hun kas zowel energie gebruiken om een kas te verwarmen maar ook opwekken middels hun Warmte Kracht Koppeling (WKK). Door slimme samenwerking tussen tuinder en energie leverancier kan samen een energie strategie bepaald worden. Echter, de echte business waarde wordt pas gecreëerd als deze concepten in productie komen. En daarvoor zijn schaarse Data Engineers nodig! In deze dataloog praten we met Rens Weijers van Manager data en strategie bij Vattenfall en Peter van t Hof Data Engineer bij Godatadriven en werkzaam bij Vattenfall. Beide heren hebben geen achtergrond in data Rens is controller van origine en Peter een Bio-informaticus. We praten in deze uitzending over hoe Vattenfall op dit moment met behulp van Data Science/ AI op het Vattenfall Analyticsl Platform (VAP) in staat is om slimme algoritmes in productie te brengen. Om hier te komen heeft Vattenfall een reis afgelegd van MapR, Hadoop, Cloudera, Scala, Cloud platform tot nu een eigen stack op Microsoft Azure. En ook praten we over Data Engineering keuzes, parquet, flink, elastic, etc. PS: Data Engineers die luisteren en een mooie baan in de energie sector zoeken kunnen met Rens contact opnemen.   shownotes op  https://www.dedataloog.nl/uitzending/dtl42-data-science-op-volle-kracht-bij-vattenfall-met-behulp-van-de-data-engineers/De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.
undefined
Nov 21, 2019 • 36min

DTL Godatafest Special 3 – Hoe de Exact mkb monitor online het meest accurate beeld van de Nederlandse economie heeft

Send us a textHoe ontwikkelt de winstgevendheid van Nederlandse bedrijven zich? Is er sprake van omzetgroei of juist een daling? En hoe lang moeten ondernemers gemiddeld wachten op hun geld? Het antwoord op deze vragen geeft de Exact mkb monitor In deze monitor wordt op basis van geanonimiseerde klantdata van 340.000 bedrijven die hun administratie bijhouden in Exact Online een beeld geschetst. Het leuke van deze innovatie is dat het voortkomt uit een interne hackathon van Exact en hierna met de directie als sponsor voortgezet door het data science-team van Exact. De dataspecialisten hebben de cijfers van de afgelopen tien jaar eerst getoetst aan andere openbare cijfers, waaronder die van het Centraal Bureau voor de Statistiek (CBS). Niet alleen is er een mooi resultaat ontwikkeld maar ook heeft Exact veel geleerd over het implementeren van Data Science in de organisatie. En bovenal biedt de gebruikte tools kansen voor nieuwe functionaliteiten voor de eindgebruikers. We spreken tijdens deze uitzending met Marichelle Gietema en Levon Goceryan van Exact over het proces om te komen tot innovatie op basis van Data Science en hun rol als Analytics Translator. Walter heeft als als host de touwtjes in handen en Jurjen gaat als vanouds helemaal los met zijn vragenvuur. Kortom een mooi einde van de specials van Godatafest.   zie shownotes op https://www.dedataloog.nl/uitzending/dtl-godatafest-special-3-hoe-de-exact-mkb-monitor-online-het-meest-accurate-beeld-van-de-nederlandse-economie-heeft/De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.
undefined
Nov 18, 2019 • 51min

DTL041 - Data Science resultaten in productie nemen met het ownR platform

Send us a textData Science en AI belanden in een fase waarin het in productie nemen van resultaten belangrijker wordt dan het doen van experimenten. Er zijn diverse manieren om AI projecten in productie te nemen (i) als rapport, (ii) als dashboard (R-Shiny of PowerBI) of (iii) als API te benaderen door een andere tool. Welke manier er ook gebruikt wordt voor implementatie, een productie omgeving stelt echter andere eisen aan de algoritmes die geschreven worden. Productie betekent: live./ beschikbaar / stabiel / veilig / snel en schaalbaar. Dit is eigenlijk alles wat het draaien op een notebook niet is. Een ideale productie platform (i) kan dan ook omgaan met verschillende versies van Python/R en packages, (ii) is schaalbaar in geheugen en computing power zodat algoritmes blijven draaien, (iii) kan omgaan gebruikers accounts. De standaard platformen waar R of Python op draaien zijn dit niet. Het ownR platform is dit wel. Hoewel we geen reclame willen maken voor een specifiek platform, kunnen we wel veel leren van een uitzending over de eigenschappen van ownR. We praten met David Kun oprichter van Functional Analytics die het ownR platform ontwikkelt. Naast data scientist is David ook nog een expert op het gebied van programmeren in python/R, de wiskunde erachter, en de veranderkundige problemen in organisaties.De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.
undefined
Nov 13, 2019 • 43min

DTL godatafest Special 2– Hoe Wehkamp in staat is om de hele organisatie toegang te geven tot het Data Science platform met Databricks

Send us a textStel je voor dat in jouw bedrijf de CTO de visie heeft gekregen dat iedere werknemers de mogelijkheid zou moeten hebben om zijn of haar werk op basis van data zelfstandig te kunnen verbeteren. Sterker, de visie is niet alleen dat iedereen dit zelfstandig zou moeten kunnen, maar ook dat werknemers die dit willen dit zelf moeten kunnen programmeren in bijvoorbeeld Python. Wat zou dat betekenen? Wehkamp heeft sinds enkele jaren deze visie omarmd en heeft middels het Databricks platform aan alle werknemers de mogelijkheid gegeven om AI zelf toe te passen in de organisatie. WOW! We praten in deze Dataloog met Arnoud de Munnik Data scientist bij Wehkamp. We praten over hoe databricks ondersteunt bij het uitrollen van Data Science binnen de organisatie, over de use case van ranking algoritmes in de praktijk, over het effect van de digitale transformatie op de rollen binnen de organisatie (software engineer neigt naar data, de data scientist leert software bouwen). We zouden nog uren kunnen doorpraten en wellicht doen we dat een andere keer nog wel! Dank aan Wehkamp voor dit mooie openhartige gesprekDe Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.
undefined
Nov 11, 2019 • 40min

DTL Google Cloud Summit Special 5 – De visie van Energyworx op het inrichten van een serverless Data Science Platform

Send us a textDigital natives, bedrijven geboren in de tijd van Big Data hebben adopteren nieuwe technologie over het algemeen makkelijke dan oudere bedrijven. Daarmee kan de visie en wijze van organiseren een voorbeeld zijn voor bedrijven die nog niet zo ver zijn. Onze energiemarkt is in transitie en data speelt daar een belangrijke rol in. Slimme meters helpen bedrijven om slim energie in te kopen en op te wekken. Slimme gebouwen, apparaten en laadpalen stemmen in samenspraak met energie leveranciers af wanneer ze het goedkoopst of duurzaamst kunnen verbruiken of opwekken. Om op het net goed te kunnen sturen is business real-time informatie nodig. Als miljoenen apparaten tegelijkertijd uitgelezen moeten worden vraagt dit een flexibele en vooral schaalbare IT infrastructuur. We praten tijdens de Google Cloud summit met Edwin Poot van Energyworx. Dit bedrijf is als digital native een expert op het binnenhalen, verwerken en toepassen van algoritmes op energy data. Ze zijn niet zozeer in Nederland actief maar wel internationaal een grote partij. Energyworx hanteert al vanaf het begin af aan een serverless paradigma en heeft haar organisatie hier geheel op ingericht. Hierdoor kan het bedrijf als er een nieuwe klant die 3,000,000 slimme meters wil aansluiten direct opschapen. Het serverless paradigma vraagt ook iets van de Data Scientists en Engineers, wat en hoe? Luister zelf maar. Even een mening van Jurjen: Zelden zo’n mooi schoolvoorbeeld van een bedrijf dat zo ingericht is als deze. WOW! https://www.energyworx.com/De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.
undefined
Nov 4, 2019 • 48min

DTL039 - De Waarde van het Data Warehouse

Send us a textWe hebben het in de Dataloog al eens gehad over het feit dat het goed op orde hebben van dat een vereiste is voor het beginnen aan Data Science (https://www.dedataloog.nl/uitzending/dtl038-data-modellen-als-voorwaarde-om-te-starten-met-ai/) . Dat begint bij een goed Data model  en een goed ingericht master data management (zoals bij Vanderlande https://www.dedataloog.nl/uitzending/dtl039-data-driven-maintenance-en-innovatie-bij-vanderlande/ ) . Als je vervolgens aan de standaard gestructureerde dataset uit het DWH diverse andere (ongestructureerde) databronnen toevoegt, praat je over een Data Lake.  Vandaag gaan we het we het hebben de waarde van het Data Warehouse en het Data Lake.   We praten met Bastiaan Sjardin over het inrichten van Data Warehouses. Hoe kom je tot een goed DWH? Hoeveel bedrijven hebben een goed werkend DHW, en wat zijn hier de requirements voor een goed DWH? Kortom, we praten over Data Maturity.De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.
undefined
Oct 30, 2019 • 35min

DTL Godatafest Special 1 - Het Microsoft Azure platform

Send us a textHet Microsoft Azure platform is wellicht het bekendste cloud platform van allemaal. Wat doe je als je een van de grootste technologie platformen in de wereld bent? Hoe ga je dan je producten en diensten uitrollen bij de eindklanten en hoe zorg je ervoor dat er echte waarde uit AI gehaald wordt? Dat doen we natuurlijk niet zonder eerst even terug te kijken natuurlijk naar de tijd van windows 3.11 maar daarna blikken ook vooruit naar wat AI en IoT ons gaan bieden. Microsoft heeft de platform gedachte en het partner-ecosysteem denken in het DNA. Dit betekent dat ze niet zelf haar tools bij eindgebruikers installeert maar met behulp van partners, groot en klein die op het Microsoft platform oplossingen maken voor eindklanten. Dat betekent nogal wat voor de structuur en het business model van de organisatie. Technologie ontwikkeling binnen het Data Science vak gaat zo snel dat je als organisatie niet al je klanten daarin mee kunt krijgen. Maar met goede innovatieve partners om je heen lukt dit wel. We gaan in gesprek met Tony Krijnen en Rudy Doornewaard over AI IOT en de Nederlandse markt. Volgens Rudy begint de laatste tijd pas echt los te komen in de Nederlandse markt. Bedrijven zien steeds vaker dat bedrijven opzoek zijn naar eenvoudige AI tools om concrete problemen op te lossen. Waar is de markt klaar voor AI, en dan niet alleen de technologie maar ook de klant van de klant? Hoe daag je dan je partners uit om ethisch om te gaan met de tools die je hebt? Kortom een mooi gesprek over AI breed, Ethical AI, en de toekomst van embedded systemsDe Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.
undefined
Oct 28, 2019 • 53min

DTL040– Data driven maintenance en innovatie bij Vanderlande

Send us a textDTL0-39 – Data driven maintenance en innovatie bij Vanderlande Vanderlande is een van de hidden champions van het Nederlandse bedrijfsleven. Per dag gaan er wereldwijd miljoenen koffers of pakketjes over transportbanden van Vanderlande. Dat deze industrie vol met data zit is evident. Niet alleen is er veel data nodig om ieder item op de juiste manier over de juiste band te laten gaan. Ook is belangrijk dat als er ergens een storing is, dat er dan real time gehandeld kan worden. Daarom is het niet de vraag of Data Science en AI hier een toepassing gaan vinden maar hoe snel! In de Dataloog van vandaag spreken we met Harm Bodewes (Director Data & Analytics) en Robbert Zijp (data architect) van Vanderlande. Beide gasten zijn trouwe luisteraars van de Dataloog en hebben zichzelf aangemeld voor een uitzending! Hoe leuk is dat!   We praten over hoe Data Science bij Vanderlande zich ontwikkeld heeft, welke plek het binnen het bedrijf gekregen heeft,over master data management, het data warehouse en data lake, welke data science producten er al draaien (oa predictive maintenance en hoe je op basis van data nieuwe producten en diensten kunt ontwikkelen. Oja en we praten nog over de hell of Excel, zie ook de shownotes op onze website!   https://www.dedataloog.nl/uitzending/dtl039-data-driven-maintenance-en-innovatie-bij-vanderlande/De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie. Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet. Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

Get the Snipd
podcast app

Unlock the knowledge in podcasts with the podcast player of the future.
App store bannerPlay store banner

AI-powered
podcast player

Listen to all your favourite podcasts with AI-powered features

Discover
highlights

Listen to the best highlights from the podcasts you love and dive into the full episode

Save any
moment

Hear something you like? Tap your headphones to save it with AI-generated key takeaways

Share
& Export

Send highlights to Twitter, WhatsApp or export them to Notion, Readwise & more

AI-powered
podcast player

Listen to all your favourite podcasts with AI-powered features

Discover
highlights

Listen to the best highlights from the podcasts you love and dive into the full episode