
DS Vandaag Bits & atomen | Wanneer spreekt AI Vlaams? (Live op de Dag van de Wetenschap)
14 snips
Nov 29, 2025 Annelies Duerinckx, wetenschapper bij Scivil, onthult het Mar-Alee project dat gesproken Vlaams-data verzamelt om AI beter te laten begrijpen. Ze legt uit waarom diverse dialectdata cruciaal is en het belang van spontane opnames. Jelle Habay, bewegingswetenschapper, deelt ervaringen over de transparantie in wetenschappelijk falen en de noodzaak om mislukte experimenten te bespreken. Samen onderzoeken ze ook de impact van grote en kleine AI-modellen op het milieu en de kwaliteit van gegevens.
AI Snips
Chapters
Transcript
Episode notes
Vlaams Is Niet Automatisch Begrepen
- AI-spraakmodellen zijn vaak getraind op Nederlands uit Nederland en missen Vlaamse varianten.
- Annelies Duerinckx benadrukt dat veel diverse Vlaamse dialectdata nodig zijn om AI Vlaams goed te laten verstaan.
Crowdsourcen Met Spontane Opnames
- Verzamel zoveel mogelijk gesproken Vlaams via burgers om dialectvariatie te vangen.
- Gebruik spontane opnames in plaats van voorgedrukte zinnen om natuurlijke taal te registreren.
Genereren Vraagt Minder Data Dan Herkennen
- Spraakgeneratie vereist veel minder data dan spraakherkenning omdat je met enkele stemmen accenten kunt simuleren.
- Herkennen van alle Vlaamse varianten vraagt veel grotere datasets door hogere variatie.
