programmier.bar – der Podcast für App- und Webentwicklung cover image

Deep Dive 191 – Text-to-Speech mit Thorsten Müller

programmier.bar – der Podcast für App- und Webentwicklung

00:00

Herausforderungen und Fortschritte in der Text-to-Speech-Technologie

In diesem Kapitel werden die Herausforderungen und Fortschritte der Text-to-Speech-Technologiethematisiert, einschließlich der Qualität synthetischer Stimmen und der Komplexität mehrsprachiger Modelle. Die Sprecher teilen ihre persönlichen Erfahrungen beim Training von Modellen wie Koki und Piper und diskutieren den Einsatz von Google Colab zur Verbesserung des Prozesses. Zusätzlich wird der Einsatz von SSML sowie kreative Projekte, wie ein YouTube-Kanal, der sich mit diesen Technologien beschäftigt, erörtert.

Transcript
Play full episode

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!
App store bannerPlay store banner
Get the app