DataGen

#212 - BlaBlaCar : Déployer un projet GenAI qui rapporte 1 million par an

Jun 30, 2025
Raphaël Berly, Data Science Lead chez BlaBlaCar, explique comment son équipe a déployé un projet GenAI qui rapporte 1 million d'euros par an. Il révèle les défis de la modération de texte et la manière dont Sphinx, un outil de classification basé sur le machine learning, a été conçu pour optimiser ce processus. La discussion aborde également les méthodologies d'organisation et la nécessité de collaborations inter-équipes pour réussir un tel projet. Enfin, il partage les prochaines étapes et les ambitions d'amélioration de l'outil.
Ask episode
AI Snips
Chapters
Transcript
Episode notes
ANECDOTE

Projet GenAI initié en hackathon

  • BlaBlaCar a lancé un projet de modération de texte en interne lors d'un hackathon.
  • En seulement deux jours, ils ont reproduit la performance de l'ancien prestataire à moindre coût.
INSIGHT

Le rôle clé de l'embedding

  • Le texte est transformé en vecteur embedding qui représente son contenu.
  • Ce vecteur est ensuite classifié par un modèle de machine learning pour catégoriser le texte.
INSIGHT

Embedding comme interprétation textuelle

  • L'embedding est la sortie de la brique d'interprétation d'un large language model.
  • Il permet de manipuler facilement techniquement ce que le modèle comprend du texte.
Get the Snipd Podcast app to discover more snips from this episode
Get the app