

#314.src - Au delà de la prédiction: Pousser les Limites de l'IA avec Vincent Maladiere
Mar 19, 2025
Vincent Maladiere, co-fondateur de Probabl et expert en analyse de données, explore la distinction entre causalité et prédiction dans l'IA. Il souligne l'importance des modèles prédictifs tout en mettant en garde contre les biais de sélection et l'analyse de survie. Avec un regard sur l'évolution de Scikit-Learn, il discute des défis d'interprétation des données manquantes et de l'impact des LLM sur les décisions automatisées. Vincent conclut en insistant sur l'apprentissage continu pour les data scientists.
AI Snips
Chapters
Transcript
Episode notes
Origines de Scikit-learn
- Scikit-learn est né à l'INRIA pour analyser les signaux du cerveau.
- Initialement, il s'agissait d'un module au sein de SciPy, axé sur la prédiction de signaux bruités.
Scikit-learn : De la recherche à la production
- Scikit-learn, initialement conçu pour la recherche, est maintenant majoritairement utilisé en production.
- Son API (fit, predict) est devenue un standard dans l'écosystème Python pour le Machine Learning.
La notion de "signal" dans Scikit-learn
- Scikit-learn traite des données structurées comme des tableaux Excel, chaque ligne représentant un échantillon.
- Un signal, au sens large, peut être une transaction, un client, ou une mesure temporelle.